パッケージソフトでもWebサービスは問いません。よろしくお願いします。
OCRは画像を解析してテキストデータにするのであって、画像ファイルがどんな機器で作成されたかは関係ありません。
デジカメであろうがアナログビデオのキャプチャーであろうが、faxだろうが、画像の質などは別にして機器に制限される事はありません。
ファイル形式の問題であれば、単に別のソフトで変換するだけの事ですし、元の形式が分からなければコメントしようがありません。
で、フリーではちょっと前と同じですが、
http://data-digital.sakura.ne.jp/RealReaderLiteTop.html
この手のものはピンキリで、業務用の何十万もするようなものの方が精度は高いです。
数万以下のものはデータの修正が必ず必要になります。
http://software.fujitsu.com/jp/ocr/socr/
(販売終了ですが中古があるでしょう)
http://www.o-rid.com/jp/features/index.html
http://www.justsystems.com/jp/download/trial/ocr/
http://mediadrive.jp/products/et/
あ、いえ、そういう意味ではなくて、画像形式が対応していなくともjpgをbmpに変換したりして、という事です。
ocr機能のあるPDF作成ソフトなどもあるようですが、一般の画像編集ソフトで、ocr機能があるものはまず無いと思います。
挙げた有料版でも、試用版があったりしますのでお試し下さい。私は古いソフトしか使っていませんので最新の物はあまり知りません。
ps
PDFファイルの文字情報はデータになっているので、そこだけをテキストデータとして抜き出す事ができ、それようのフリーなどもいくつか出ています。
PDFは絵の部分は画像ファイルで、文字の部分は文字コードになっています。
了解しました。
ご紹介いただいたものから画像→文字変換できるものを試してみます。
今時、多くのOCRソフトでデジカメに対応していますし、デジカメに特化した製品まで売られています。
http://trendy.nikkeibp.co.jp/article/col/20050804/113038/?rt=nocnt
問題なのはフリーであろうが、市販パッケージであろうが精読率にあります。元々OCRソフトというのは600dpi以下で10ポイント前後のフォントでデータを構築しています。デジカメの高画素数で撮影したデータだとこれを簡単に超えてしまい、誤読が発生する確率が高いばかりか、ソフトによっては読めないことがあります。
また、データが対象物に対して傾いていた場合などスキャナで撮影したデータと比較して誤読が発生する可能性は高くなります。
業者に書籍の撮影を依頼する場合、専用の台に載せてさらにガラスで押さえてから撮影すると言ったことが行われます。
まず、私の回答は基本的に特定のソフトを推奨するものではありません。OCRの実施に対して市販のソフトのどれを使うかというのは、原稿の状態、内容、OCRに掛けられる時間、期待する読み取り精度によって全て異なります。
私は過去に有名な市販ソフトを4つ使い分けていました。読取革命、e-Typist、読んde!!ココ、OfficeManager。どういった本ならこのソフトがオススメというのがある程度決まってきます。私の場合現在で言う自炊が目的で、対象は書籍だけで時間を短縮するためにそうしたのです。
撮影が専用台に固定したカメラで行われ、書籍ならガラス押さえを施し、あるいは紙原稿であれば、『やさしくデジカメOCR』の必要もありません。画像精度を調節すれば済む話しです。
『やさしくデジカメOCR』の魅力は手ブレやピンボケ、曲がった原稿といったデジカメ特有の画像補正機能を有している点で、認識エンジンはe-Typistと同じです。
e-Typistの認識エンジンの特徴は文章の影響を受けやすい点にあります。画像よりも文脈から文字を判断してしまうのです。ですから、専門書やビジネス書類を苦手とする傾向があります。
どういった文書なのかが不明なまま、私が特定のソフトを奨めることはありません。
例えば、帳票ならOCRは高額の業務用を勧めるでしょう。高額の業務用OCRソフトは伝票の認識精度を高めることに特化したソフトですから。
伝票をOCRする場合でも専用台を使わないなら、一度『やさしくデジカメOCR』で画像補正を行った上で、業務用のソフトでOCRといったという場合もありえます。
OCRソフト毎の得手不得手、参考になりました。
ありがとうございます。
"PDFや画像ファイル"
D&Dでいけますよ
デジカメで撮ったJPEGでもできました。
ありがとうございます!
"PDFや画像ファイル"
2012/02/26 22:25:23D&Dでいけますよ
デジカメで撮ったJPEGでもできました。
2012/02/27 06:55:25ありがとうございます!