PDFデータをテキストに読み込むＯＣＲソフトでフリーかシェアウェアのものを探しています。

Question

clinejp

1288

1275もっと見る

80pt

コンピュータ書籍・音楽・映画

PDFデータをテキストに読み込むＯＣＲソフトでフリーかシェアウェアのものを探しています。

スキャナの機種はＦＵＪＩＴＳＵのＳＣＡＮＳＮＡＰ　Ｓ３００です。
よろしくお願いいたします。

回答の条件

URL必須
1人2回まで

登録：2007/11/17 19:00:50
終了：2007/11/18 04:13:17

※ 有料アンケート・ポイント付き質問機能は2023年2月28日に終了しました。

No.1

j1960322212007/11/17 19:07:10

27pt

質問の意味が不明確なのですが、一応フリーのOCRソフトを挙げておきます。

スキャナーで読み取った画像ファイルからテキストを抽出してくれます。

独自エンジンを搭載したフリーの日本語OCRソフト「SmartOCR Lite Edition」

http://www.forest.impress.co.jp/article/2005/11/29/smartocrlite....

No.2

ZONMAX1342007/11/17 22:05:24

24pt

これはいかがでしょうか？

1日に5ファイルまでOCR処理可能となっております。

「クセロReaderZERO」

http://xelo.jp/xelopdf/readerzero/index.html

コメントはまだありません

「あの人に答えてほしい」「この質問はあの人が答えられそう」というときに、回答リクエストを送ってみてましょう。

これ以上回答リクエストを送信することはできません。制限について

リクエスト送信済

回答リクエストを送信したユーザーはいません

YUUH32 · Accepted Answer · 2007-11-18T01:25:55+09:00

１さん、SmartOCRは現在会社が存在してません。製造中止＆配布中止です（あるところにはあるけども）。

で、私も質問の意味が分かりませんけども、２つの方向から回答してみます。

（１）PDFからテキストデータを抽出する

XDOC2TXTというツールでできます。

http://www31.ocn.ne.jp/~h_ishida/xdoc2txt.html

PDFの中のテキストが画像データ、つまり文字に見えるけれども実は画像であるという場合”以外”に使えます。

（２）実は画像であるテキストをOCRのようにテキスト化する

たぶん、こっちなんでしょうけども、

こことか

http://metac.cocolog-nifty.com/script/2005/12/pdf_21c7.html

こことか（2chですけども）

http://pc11.2ch.net/test/read.cgi/software/1141635878/571-617

こことか

http://www.sourcenext.com/products/pdf_todata/

いろいろあります。シェアウェアでよいというならつまり有料で良いと言う事だと解釈しまして、ソースネクストの「いきなりPDF to Data」が３９７０円とお安いです。

・・・というか、実はこっちを最初に言いたかったんですけども、回答にならないから最後に回したんですが・・・

SCANSNAPには自動PDF化＋OCR機能＋PDFに透明テキストの貼付け機能がもともと付いています。

http://scansnap.fujitsu.com/jp/product/s510/function/soft-1.html

僕も便利に使ってます。これでスキャンした文書はある程度検索可能にできるのですごく便利です。

ということで、SCANSNAPなら他にOCRソフトは不要だと思います。

テキスト抽出したいならXDOC2TXTが便利です。これも使った事あります。速くていいです。

YUUH32 · Accepted Answer · 2007-11-18T01:25:55+09:00

１さん、SmartOCRは現在会社が存在してません。製造中止＆配布中止です（あるところにはあるけども）。

で、私も質問の意味が分かりませんけども、２つの方向から回答してみます。

（１）PDFからテキストデータを抽出する

XDOC2TXTというツールでできます。

http://www31.ocn.ne.jp/~h_ishida/xdoc2txt.html

PDFの中のテキストが画像データ、つまり文字に見えるけれども実は画像であるという場合”以外”に使えます。

（２）実は画像であるテキストをOCRのようにテキスト化する

たぶん、こっちなんでしょうけども、

こことか

http://metac.cocolog-nifty.com/script/2005/12/pdf_21c7.html

こことか（2chですけども）

http://pc11.2ch.net/test/read.cgi/software/1141635878/571-617

こことか

http://www.sourcenext.com/products/pdf_todata/

いろいろあります。シェアウェアでよいというならつまり有料で良いと言う事だと解釈しまして、ソースネクストの「いきなりPDF to Data」が３９７０円とお安いです。

・・・というか、実はこっちを最初に言いたかったんですけども、回答にならないから最後に回したんですが・・・

SCANSNAPには自動PDF化＋OCR機能＋PDFに透明テキストの貼付け機能がもともと付いています。

http://scansnap.fujitsu.com/jp/product/s510/function/soft-1.html

僕も便利に使ってます。これでスキャンした文書はある程度検索可能にできるのですごく便利です。

ということで、SCANSNAPなら他にOCRソフトは不要だと思います。

テキスト抽出したいならXDOC2TXTが便利です。これも使った事あります。速くていいです。

PDFデータをテキストに読み込むＯＣＲソフトでフリーかシェアウェアのものを探しています。

ベストアンサー

YUUH329352007/11/18 01:25:55

その他の回答（2件）

j1960322212007/11/17 19:07:10

ZONMAX1342007/11/17 22:05:24

YUUH329352007/11/18 01:25:55ここでベストアンサー

コメント（0件)

この質問への反応（ブックマークコメント）