会社で打ち込み作業が多いため、OCRを導入することで、打ち込みにかかるコストを減らしたいな、と考えています。そこで精度が高いOCRを探したいのですが、一度も使ったことがないので、どのメーカーがいいかも良く分かりません。


ソフトのものや、スキャナ本体のバージョンなど、色んなパターンであるんですかね?何回か検索したのですが、その辺から分かりません。

是非、実際に使ったことがある方からの意見をお待ちしております。実際にOCRを使うのは書類、新聞紙、本などを想定しています。使用イメージとしては、書類をOCRにかけることでテキストファイル化するというものです。もちろん、文字修正のためのアルバイトは雇いますが、出来る限りチェックの工数も減らしたいと考えています。

ご教授願います。

回答の条件
  • URL必須
  • 1人2回まで
  • 登録:
  • 終了:2009/10/22 19:34:38
※ 有料アンケート・ポイント付き質問機能は2023年2月28日に終了しました。

ベストアンサー

id:hirovlsi No.3

回答回数66ベストアンサー獲得回数8

ポイント30pt

単体でテキストファイル化ができます。

楽2ライブラリパーソナルは作成したファイルを「本棚に収める、本をペラペラと

めくる様に閲覧できる」という整理用のソフトです。雑誌などをスキャン・PDF化

してパソコンの中に自分だけの電子本棚を作成することができます。

このソフトは別売りで買うことができますが、セットの方が価格的にお徳です。

必要なければscansnap単体で購入されることをお勧めします。


漢字、ひらがな、カタカナが混じると精度が落ちますが、それでも画像ファイル化

OCR実行するよりも精度が高いです。機材にOCR実行をサポートする機能が入って

いるのでしょうね。100%の精度でなくなってしまいますが、自動で複数枚の紙を

両面読み込みできますので作業は軽くなると思います。

精度は読み込む紙の印刷状態に影響されます。潰れ、擦れ、手書き等ですと

上手く読み取れないことがあります。


あとscansnapはバージョンアップの度に読み取り速度の向上や機能の追加がされて

います。例えば最新のものではマーカーで囲った部分を自動認識し切り出してくれる

様です。テキスト化したものを修正すれば良いだけの話ではありますが、PDF化する

場合には指定範囲のみを画像付き(テキスト選択可能)で保存できますので便利です。


最後に下のサイトの様にS300という小さく持ち運びに便利なものがありますが、持ち

出したりすることがなければS1500をお勧めします。読み込みスピードがS1500の方が

速いですしA3サイズにも対応しています。

http://scansnap.fujitsu.com/jp/product/s300/

その他の回答4件)

id:hirovlsi No.1

回答回数66ベストアンサー獲得回数8

ポイント30pt

富士通のscansnapが扱い易いと思います。

http://scansnap.fujitsu.com/jp/

S1500という型番が最新バージョンですが、古い型番のS500を使用しております私の感想としては

その他の画像保存用スキャナで取り込んだ画像をOCRにかけるよりも

この機材でテキスト読み込みの様なモードでOCRをかけるとかなり文字化けが少ないです。

英数字のみを対象とした場合は100%に近い完璧さでした。

またトレイに差し込んだペーパーを次々と自動でスキャンできますし、自動両面読み込み

にも対応しています。

id:nozomukubota

おお、素晴らしい。ありがとうございます。

では、S1500のみを購入すればテキスト読み込みが可能ということですかね?

amazonで検索すると、FUJITSU ScanSnap S1500 FI-S1500 というものと、FUJITSU ScanSnap S1500 楽2ライブラリパーソナルV5.0セットモデル FI-S1500-SR のものがあるようですが、FUJITSU ScanSnap S1500 FI-S1500 単体でテキストファイル化までは可能なのでしょうか?

また、英数字は100%とのことですが、漢字やひらがな、カタカナが混じるとどの程度の精度になるのでしょうか?

2009/10/21 23:20:25
id:NazeNani No.2

回答回数1615ベストアンサー獲得回数276

ポイント25pt

パーソナル用では、実際に使った方による比較実験がありました。:

http://shitei.seesaa.net/article/37824278.html

ここではエプソンのOCRソフト「読んdeココ!」が優位な様ですが、

特にエプソンのスキャナ+エプソンのOCRソフトは相性が良いらしいです。

パーソナル用は、やはり打ち込み校正ができる環境で使用した方が良いと思います。

私個人はCanonのA4とMustekA3のスキャナを使っているのと、

英文の文書を読み込むのが主なので、マック版もある

e.Typistを使っていますが、日本語を扱う時は、段組みや

レイアウトを部分的に手作業で設定しなければならない場合もあります。


大量の電子文書化用の業務用OCRでは、年間保守サービス付きのがあります。:

http://mediadrive.jp/products/wrp/index.html

これは高額ですが、パーソナル用よりも高精度が売りの業務用です。

校正は軽い目通しくらいしかできない、大量文書に向いています。

e.Typistと同じメーカーメヂアドライブによるもので、

電子文書化に適した業務用の上位機種です。

id:hirovlsi No.3

回答回数66ベストアンサー獲得回数8ここでベストアンサー

ポイント30pt

単体でテキストファイル化ができます。

楽2ライブラリパーソナルは作成したファイルを「本棚に収める、本をペラペラと

めくる様に閲覧できる」という整理用のソフトです。雑誌などをスキャン・PDF化

してパソコンの中に自分だけの電子本棚を作成することができます。

このソフトは別売りで買うことができますが、セットの方が価格的にお徳です。

必要なければscansnap単体で購入されることをお勧めします。


漢字、ひらがな、カタカナが混じると精度が落ちますが、それでも画像ファイル化

OCR実行するよりも精度が高いです。機材にOCR実行をサポートする機能が入って

いるのでしょうね。100%の精度でなくなってしまいますが、自動で複数枚の紙を

両面読み込みできますので作業は軽くなると思います。

精度は読み込む紙の印刷状態に影響されます。潰れ、擦れ、手書き等ですと

上手く読み取れないことがあります。


あとscansnapはバージョンアップの度に読み取り速度の向上や機能の追加がされて

います。例えば最新のものではマーカーで囲った部分を自動認識し切り出してくれる

様です。テキスト化したものを修正すれば良いだけの話ではありますが、PDF化する

場合には指定範囲のみを画像付き(テキスト選択可能)で保存できますので便利です。


最後に下のサイトの様にS300という小さく持ち運びに便利なものがありますが、持ち

出したりすることがなければS1500をお勧めします。読み込みスピードがS1500の方が

速いですしA3サイズにも対応しています。

http://scansnap.fujitsu.com/jp/product/s300/

id:sabuibo No.5

回答回数266ベストアンサー獲得回数20

ポイント20pt

東芝がお勧めです。業界で最も精度が良いと第三者評価された、と東芝関係者から聞いたことがあります。

http://pf.toshiba-sol.co.jp/prod/ocr/index_j.htm

  • id:ttakao
    もし、日本語を対象と考えているのであれば、一度、どこかで試すことを強くお勧めします。
    99%の変換率ってすごそうに思いますが、100文字に一個は間違いがあるということです。
    端的にいえば、よっぱらいにキーインさせて間違ってたら仕方ないね、くらいのものです。結果、OCRで間違いがない精度が欲しいのならば、原文と人間が全部比べるしか方法がないのが現実です。
    英数字ならば、かなりいい精度なのですけどね。

この質問への反応(ブックマークコメント)

「あの人に答えてほしい」「この質問はあの人が答えられそう」というときに、回答リクエストを送ってみてましょう。

これ以上回答リクエストを送信することはできません。制限について

回答リクエストを送信したユーザーはいません