« Leopardリリース | トップページ | SUGOCA »

2007.10.29

ココログのCAPTCHAは簡単に破れる
かもしれない

凪瀬 Blogさんに「はてなのCAPTCHAは簡単に破れる」というのがあったので、触発されて(違)ココログのCAPTCHAも調べてみた。

とりあえず20個程てきと~に取ってみて、並べてみた。
ココログのCAPTCHA
netpbmで↓こんな感じでてきと~に処理してみる
pngtopnm <CAPTCHA.png |ppmtopgm|pgmtopbm -threshold -value 0.3 |pnmtopng >CAPTCHA_clean.png
ココログのCAPTCHA(二値化後)

はてなよりは英字が多いけど、全部小文字っぽいから、高々26文字+数字で計36文字・・・なんだけど、数字の0(ゼロ)と1(イチ)とか英字の0(オー)とl(エル)は無いのかもしれない。
まぁ、もっとサンプルを取ってみるとわかるでしょうが。

あと、はてなではノイズは足すだけのようですが、ココログでは引く場合もある。
でも、直線のノイズは足すだけで、ドットのノイズだけ引かれてる場合もある感じなので、もうちょっとインテリジェントに(謎)、
・周囲が全部白で一点だけ黒ならノイズとみなして白にする
・周囲が全部黒で一点だけ白ならノイズとみなして黒にする
という程度のフィルターをかければ、かなり減らせるんじゃないかと・・・
まぁ、ドットが並んでる所もあるので、全部は取りきれませんが。

あとの
・文字の位置がドット単位で固定であるため切り出しが非常に容易
というのは同じだし
・色が限られるため、2値化することが非常に容易
というのは、元がグレースケールのPNGだし、JPEGのノイズもなく、はてなより簡単かもしれない。
まぁ、背景がちょっと凝ってます(^^;が、上でnetpbmで処理したように、背景と文字ではコントラストが十分あるので、thresholdを調整してやれば難なく除けます。

という事で、「ココログのCAPTCHAは簡単に破れる」かもしれない(^^;

※「ココログのCAPTCHAなんて見た事ね~よ」という方で見てみたい(^^;方は、950の記事にコメントしてみると高い確率で出る・・・かもしれない(^^;
本文に
「CAPTCHAテスト」
と書いておいて頂ければ、誤って(違)CAPTCHAが出ないで登録されてしまっても黙って消しますので、気にせずに(^^;書いてみてください。

|

« Leopardリリース | トップページ | SUGOCA »

ウェブログ・ココログ関連」カテゴリの記事

コメント

コメントを書く



(ウェブ上には掲載しません)




トラックバック

この記事のトラックバックURL:
http://app.cocolog-nifty.com/t/trackback/4003/16913782

この記事へのトラックバック一覧です: ココログのCAPTCHAは簡単に破れる
かもしれない
:

» ココログのCAPTCHAも貧弱らしい [凪瀬 Blog]
ココログのCAPTCHAも貧弱らしい [続きを読む]

受信: 2007.10.30 10:38

« Leopardリリース | トップページ | SUGOCA »