人力検索はてな
モバイル版を表示しています。PC版はこちら
i-mobile

【PCソフト】
読んでココなどのOCRソフトの選定を協力して頂ければと思います。
活字書類をスキャニングして、OCRソフトにてテキスト情報にして行きたいと思いますが、元の活字書類が古かったり、書き込みがあったりでOCRソフトは中々上手にテキストに変換してくれません。
新たにOCRソフトを購入するならば、メーカーやソフトの発売時期によって、読込精度などに違いがあるのかなども知りたいと思います。
皆様のご意見をお願いいたします。

●質問者: galpapa
●カテゴリ:ビジネス・経営 コンピュータ
✍キーワード:OCR pc ソフト テキスト メーカー
○ 状態 :終了
└ 回答数 : 2/2件

▽最新の回答へ

1 ● pahoo
●35ポイント

私がOCRとして愛用しているソフト

読取革命Ver.12 製品版

読取革命Ver.12 製品版

  • 出版社/メーカー: パナソニック
  • 発売日: 2008-02-29
  • メディア: CD-ROM


スキャナの性能にもよるのですが、文庫本や新聞記事でしたら、家庭用のプリンタ・スキャナ複合機で400dpi/モノクロで取り込むことで、90%以上の識字率が出ています。


2 ● aki1960
●35ポイント

http://q.hatena.ne.jp/answer URLはダミーです。

どの様な目的にOCRを使われるのかわかりませんが、例えば1000文字/A4の、ページ毎に様々なタイプの活字が使われている原稿があったとして、誤り無く1ページを読み取るソフトは現状ではありません。

単純に計算してみればわかりますが、読み取り精度99%のソフトがスペック通り動いたとしても、1000文字あれば10文字は間違えます。

学習機能を持ったソフトもありますが、これも活字タイプが変われば学習させなおす必要がありますし、あまりに多くを学習されると逆に精度が低下します。

業務用など大量処理が必要かつ精度も必要な場合は、目的が明確になっている(例えば住所や氏名)辞書を併用して、OCR後に辞書によって補正しているのが現状です。

それでも、例えば「運転免許証」のように文字の切り出し位置と活字が決まっているもので、やっと実用になる、といった程度です。

様々なタイプの文書を大量にテキスト化するの必要があるのなら「上海で人海戦術」の様な方法が、現状では最も有効です。

(逆に、多少間違っていてもかまわない(大意がつかめればOK)、というのならOCRが役に立ちます。)

関連質問


●質問をもっと探す●



0.人力検索はてなトップ
8.このページを友達に紹介
9.このページの先頭へ
対応機種一覧
お問い合わせ
ヘルプ/お知らせ
ログイン
無料ユーザー登録
はてなトップ