jpegファイルやgifファイルに描かれている数字をperlを用いて読み出したいのですが、どのようにすればいいでしょうか？

Question

norix31

45

45もっと見る

176pt

ウェブ制作

jpegファイルやgifファイルに描かれている数字をperlを用いて読み出したいのですが、どのようにすればいいでしょうか？

回答の条件

URL必須
1人2回まで

登録：2004/04/27 12:54:43
終了：--

※ 有料アンケート・ポイント付き質問機能は2023年2月28日に終了しました。

かほちゅう 2004/04/28 14:07:06

数値よりグラフ

http://www.chuden.co.jp/hamaokastate1/h-index.html
を見てみて気がついたのですが、数値を認識するよりも
グラフのマークをGDなどの画像処理ライブラリを使って
走査した方が簡単ですね。
X座標は固定で４箇所、Y座標も0〜20、小数点1桁なので
4*200回程度の走査で数値化できます。

「あの人に答えてほしい」「この質問はあの人が答えられそう」というときに、回答リクエストを送ってみてましょう。

これ以上回答リクエストを送信することはできません。制限について

リクエスト送信済

回答リクエストを送信したユーザーはいません

kodomono-omocha · Answer 1 · 2004-04-27T13:11:44+09:00

No.1

kodomono-omocha40662004/04/27 13:11:44

無理。

それができないから、それを利用した認証システムがあるんです。

無理って…

OCRソフトで、数字や文字の読み込みは普通にできていますよ。

おっしゃってるような認証システムでは、プログラムで解析されないように数字はゆがんで

描かれていますよね。逆にいうと、一般のフォントで描かれているいる数字は読み込める

ということですよね。

私、別に、どこかをクラッキングしようというわけではないので、一般のフォントで

描かれている数字を読み込めればいいです。

2004/04/27 13:25:02

aki73ix · Answer 2 · 2004-04-27T13:25:07+09:00

・まず配列上にJPEGやGIFを展開する

・二値化してエッジ検出処理を自前でつくってOCRプログラムを作る

とここまでしないと駄目です

でも、PERLでやるのはちょっと死を見そうですね(^^;

1000万円位もらったら作ってもいいかなと考えるかも知れませんが・・・そのくらい大変です

aki73ix · Answer 3 · 2004-04-27T13:37:08+09:00

これを見るとグラフの形状、数字の位置がある程度決まってるようですね

・まず配列に、座標ごとのピクセル値を入れてやってから・・・

１．グラフの色がついてる場所を縦にスキャンしてやれば、数字の値が大体分かるかと思います。

２．処理は多少複雑になりますが、文字のフォントが分かっていますから、あらかじめサンプリングした数字と比較してやれば、Hit率の高いOCRソフトが作れると思います

とりあえず、画像ファイルの展開が処理の大部分になるかと思います(^^;

kodomono-omocha · Answer 4 · 2004-04-27T13:49:02+09:00

perlでOCR作って、数値読み込み、データをフィルタにかけ選別、データベースに登録、展開。

これを無理といわずしてなんという。

これを「できないことはない」というのは「火星に行けないことはない」と言ってるようなもんだ。金と時間をつぎ込めばきっとできる。（笑）

冗談はおいといて。

自分で作った画像を読むんだったらJAVAでそういうのみたことあるけど、あくまでも専用の画像。

がんばって手入力した方が簡単だろう。

それだったら、定期的に巡回して画像を落として来て並べて表示するスクリプトを組んでやればいいことだし。

何もperlじゃなくても、定期的にダウンロードしてきて、画像をOCRにかけ、データをcsvに変換してどんどん追加して行くみたいなのVBとかでやった方がよっぽど確実、簡単。

kiichigo · Answer 5 · 2004-04-27T14:31:59+09:00

http://member.nifty.ne.jp/hippo2000/perltips/gdmemo.htm

GDモジュールで指定座標の色の値が取得できるので

特定の位置の数字が1の時は、この座標が黒のはずなど

こまごまとやってけば、数値を読み取ることは可能です。

大変ですが、0~9のパターンと基準点で読み取る関数でも作れば出来ないことはなさそうです。

かほちゅう · Answer 6 · 2004-04-27T14:48:41+09:00

http://jinrui.zool.kyoto-u.ac.jp/~takechan/?OCR%A4%F2%BB%C8%A4%A...

画像変換が別途必要かもしれませんが、英数字であればオープンソースのGOCRが使えると思います。

外部コマンドとして起動すればPerlからでも制御できます。

http://packages.debian.org/stable/graphics/gocr

Debian -- Details of package gocr in lenny

Asta · Answer 7 · 2004-04-27T16:28:36+09:00

http://www.abbyy.com/

ABBYY - OCR, ICR, OMR, Data Capture and Linguistic Software

perl単体ではやはり厳しいのではないかと思われます。

画像認識系を専攻してたとかであれば別でしょうけど・・

で、質問にあるような、比較的ユーザーが自由にコントロール出来るモノと考えると、ＯＣＲ関連ライブラリのAPIをperlで呼ぶ、というのが妥当な線ではないでしょか。

ちなみに、私の知る限りperlのAPIはまだ見たことがないっす。よってOCRライブラリ及びそれで使用されている言語を使用してperlとのインターフェイス部分を作るといったカンジの作業をやんなきゃならないのでやっぱりちょっと大変かも。

識字率はベンダー提供データをみるしかないですが、商用モノの有名どころなどは、それなりに読めるよーな気がします。売ってるわけだし。。あー日本語はどうでしょうねえ。。

他、探せば商用ソフトクラスのフリーなライブラリもあると思いますので探してみてはいかがでしょ。

leadはコーレルとかマイクロソフトのグラフィックソフトのコアエンジンに採用されてる様子。速度は速いし性能もフォトショ並。OCR周りは不明・・

http://www.leadtools.com/

LEADTOOLS is the world LEADing SDK for imaging technologies.

http://www.pegasusimaging.com/

Accusoft Pegasus | Imaging SDKs | Image Viewers | Image Compression SDKS

sinono · Answer 8 · 2004-04-27T18:12:02+09:00

http://d.hatena.ne.jp/sinono/

早くも引退を考え中……

言語は違うけど数字認識プログラムの経験者です。参考にならなければポイント不要です。

前提条件として、数字の出力座標が決まっていたので、まず数字のドット絵を紙にメモしました。

ポイントは、

1.数字ごとの座標（左上一点）

2.数字の比較できる列の考察（全ドット判定すると面倒なので、0〜9の分岐ができればよい。意外と忘れてはいけないのが座標に数字がないようなエラーパターン）

これが分かってしまえ、2を使って「数字を判定する関数」を作り、1を使って「判定をループする処理」を作れば完成です。

jpegファイルやgifファイルに描かれている数字をperlを用いて読み出したいのですが、どのようにすればいいでしょうか？

回答（8件）

kodomono-omocha40662004/04/27 13:11:44

aki73ix5224272004/04/27 13:25:07

aki73ix5224272004/04/27 13:37:08

kodomono-omocha40662004/04/27 13:49:02

kiichigo16702004/04/27 14:31:59

かほちゅう16202004/04/27 14:48:41

Asta202004/04/27 16:28:36

sinono5202004/04/27 18:12:02

コメント（1件)

この質問への反応（ブックマークコメント）