ソフトのものや、スキャナ本体のバージョンなど、色んなパターンであるんですかね?何回か検索したのですが、その辺から分かりません。
是非、実際に使ったことがある方からの意見をお待ちしております。実際にOCRを使うのは書類、新聞紙、本などを想定しています。使用イメージとしては、書類をOCRにかけることでテキストファイル化するというものです。もちろん、文字修正のためのアルバイトは雇いますが、出来る限りチェックの工数も減らしたいと考えています。
ご教授願います。
単体でテキストファイル化ができます。
楽2ライブラリパーソナルは作成したファイルを「本棚に収める、本をペラペラと
めくる様に閲覧できる」という整理用のソフトです。雑誌などをスキャン・PDF化
してパソコンの中に自分だけの電子本棚を作成することができます。
このソフトは別売りで買うことができますが、セットの方が価格的にお徳です。
必要なければscansnap単体で購入されることをお勧めします。
漢字、ひらがな、カタカナが混じると精度が落ちますが、それでも画像ファイル化
OCR実行するよりも精度が高いです。機材にOCR実行をサポートする機能が入って
いるのでしょうね。100%の精度でなくなってしまいますが、自動で複数枚の紙を
両面読み込みできますので作業は軽くなると思います。
精度は読み込む紙の印刷状態に影響されます。潰れ、擦れ、手書き等ですと
上手く読み取れないことがあります。
あとscansnapはバージョンアップの度に読み取り速度の向上や機能の追加がされて
います。例えば最新のものではマーカーで囲った部分を自動認識し切り出してくれる
様です。テキスト化したものを修正すれば良いだけの話ではありますが、PDF化する
場合には指定範囲のみを画像付き(テキスト選択可能)で保存できますので便利です。
最後に下のサイトの様にS300という小さく持ち運びに便利なものがありますが、持ち
出したりすることがなければS1500をお勧めします。読み込みスピードがS1500の方が
速いですしA3サイズにも対応しています。
富士通のscansnapが扱い易いと思います。
http://scansnap.fujitsu.com/jp/
S1500という型番が最新バージョンですが、古い型番のS500を使用しております私の感想としては
その他の画像保存用スキャナで取り込んだ画像をOCRにかけるよりも
この機材でテキスト読み込みの様なモードでOCRをかけるとかなり文字化けが少ないです。
英数字のみを対象とした場合は100%に近い完璧さでした。
またトレイに差し込んだペーパーを次々と自動でスキャンできますし、自動両面読み込み
にも対応しています。
パーソナル用では、実際に使った方による比較実験がありました。:
http://shitei.seesaa.net/article/37824278.html
ここではエプソンのOCRソフト「読んdeココ!」が優位な様ですが、
特にエプソンのスキャナ+エプソンのOCRソフトは相性が良いらしいです。
パーソナル用は、やはり打ち込み校正ができる環境で使用した方が良いと思います。
私個人はCanonのA4とMustekA3のスキャナを使っているのと、
英文の文書を読み込むのが主なので、マック版もある
e.Typistを使っていますが、日本語を扱う時は、段組みや
レイアウトを部分的に手作業で設定しなければならない場合もあります。
大量の電子文書化用の業務用OCRでは、年間保守サービス付きのがあります。:
http://mediadrive.jp/products/wrp/index.html
これは高額ですが、パーソナル用よりも高精度が売りの業務用です。
校正は軽い目通しくらいしかできない、大量文書に向いています。
e.Typistと同じメーカーメヂアドライブによるもので、
電子文書化に適した業務用の上位機種です。
単体でテキストファイル化ができます。
楽2ライブラリパーソナルは作成したファイルを「本棚に収める、本をペラペラと
めくる様に閲覧できる」という整理用のソフトです。雑誌などをスキャン・PDF化
してパソコンの中に自分だけの電子本棚を作成することができます。
このソフトは別売りで買うことができますが、セットの方が価格的にお徳です。
必要なければscansnap単体で購入されることをお勧めします。
漢字、ひらがな、カタカナが混じると精度が落ちますが、それでも画像ファイル化
OCR実行するよりも精度が高いです。機材にOCR実行をサポートする機能が入って
いるのでしょうね。100%の精度でなくなってしまいますが、自動で複数枚の紙を
両面読み込みできますので作業は軽くなると思います。
精度は読み込む紙の印刷状態に影響されます。潰れ、擦れ、手書き等ですと
上手く読み取れないことがあります。
あとscansnapはバージョンアップの度に読み取り速度の向上や機能の追加がされて
います。例えば最新のものではマーカーで囲った部分を自動認識し切り出してくれる
様です。テキスト化したものを修正すれば良いだけの話ではありますが、PDF化する
場合には指定範囲のみを画像付き(テキスト選択可能)で保存できますので便利です。
最後に下のサイトの様にS300という小さく持ち運びに便利なものがありますが、持ち
出したりすることがなければS1500をお勧めします。読み込みスピードがS1500の方が
速いですしA3サイズにも対応しています。
東芝がお勧めです。業界で最も精度が良いと第三者評価された、と東芝関係者から聞いたことがあります。
おお、素晴らしい。ありがとうございます。
では、S1500のみを購入すればテキスト読み込みが可能ということですかね?
amazonで検索すると、FUJITSU ScanSnap S1500 FI-S1500 というものと、FUJITSU ScanSnap S1500 楽2ライブラリパーソナルV5.0セットモデル FI-S1500-SR のものがあるようですが、FUJITSU ScanSnap S1500 FI-S1500 単体でテキストファイル化までは可能なのでしょうか?
また、英数字は100%とのことですが、漢字やひらがな、カタカナが混じるとどの程度の精度になるのでしょうか?