スキャナの機種はFUJITSUのSCANSNAP S300です。
よろしくお願いいたします。
1さん、SmartOCRは現在会社が存在してません。製造中止&配布中止です(あるところにはあるけども)。
で、私も質問の意味が分かりませんけども、2つの方向から回答してみます。
(1)PDFからテキストデータを抽出する
XDOC2TXTというツールでできます。
http://www31.ocn.ne.jp/~h_ishida/xdoc2txt.html
PDFの中のテキストが画像データ、つまり文字に見えるけれども実は画像であるという場合”以外”に使えます。
(2)実は画像であるテキストをOCRのようにテキスト化する
たぶん、こっちなんでしょうけども、
こことか
http://metac.cocolog-nifty.com/script/2005/12/pdf_21c7.html
こことか(2chですけども)
http://pc11.2ch.net/test/read.cgi/software/1141635878/571-617
こことか
http://www.sourcenext.com/products/pdf_todata/
いろいろあります。シェアウェアでよいというならつまり有料で良いと言う事だと解釈しまして、ソースネクストの「いきなりPDF to Data」が3970円とお安いです。
・・・というか、実はこっちを最初に言いたかったんですけども、回答にならないから最後に回したんですが・・・
SCANSNAPには自動PDF化+OCR機能+PDFに透明テキストの貼付け機能がもともと付いています。
http://scansnap.fujitsu.com/jp/product/s510/function/soft-1.html
僕も便利に使ってます。これでスキャンした文書はある程度検索可能にできるのですごく便利です。
ということで、SCANSNAPなら他にOCRソフトは不要だと思います。
テキスト抽出したいならXDOC2TXTが便利です。これも使った事あります。速くていいです。
質問の意味が不明確なのですが、一応フリーのOCRソフトを挙げておきます。
スキャナーで読み取った画像ファイルからテキストを抽出してくれます。
独自エンジンを搭載したフリーの日本語OCRソフト「SmartOCR Lite Edition」
http://www.forest.impress.co.jp/article/2005/11/29/smartocrlite....
これはいかがでしょうか?
1日に5ファイルまでOCR処理可能となっております。
「クセロReaderZERO」
1さん、SmartOCRは現在会社が存在してません。製造中止&配布中止です(あるところにはあるけども)。
で、私も質問の意味が分かりませんけども、2つの方向から回答してみます。
(1)PDFからテキストデータを抽出する
XDOC2TXTというツールでできます。
http://www31.ocn.ne.jp/~h_ishida/xdoc2txt.html
PDFの中のテキストが画像データ、つまり文字に見えるけれども実は画像であるという場合”以外”に使えます。
(2)実は画像であるテキストをOCRのようにテキスト化する
たぶん、こっちなんでしょうけども、
こことか
http://metac.cocolog-nifty.com/script/2005/12/pdf_21c7.html
こことか(2chですけども)
http://pc11.2ch.net/test/read.cgi/software/1141635878/571-617
こことか
http://www.sourcenext.com/products/pdf_todata/
いろいろあります。シェアウェアでよいというならつまり有料で良いと言う事だと解釈しまして、ソースネクストの「いきなりPDF to Data」が3970円とお安いです。
・・・というか、実はこっちを最初に言いたかったんですけども、回答にならないから最後に回したんですが・・・
SCANSNAPには自動PDF化+OCR機能+PDFに透明テキストの貼付け機能がもともと付いています。
http://scansnap.fujitsu.com/jp/product/s510/function/soft-1.html
僕も便利に使ってます。これでスキャンした文書はある程度検索可能にできるのですごく便利です。
ということで、SCANSNAPなら他にOCRソフトは不要だと思います。
テキスト抽出したいならXDOC2TXTが便利です。これも使った事あります。速くていいです。
コメント(0件)