Sebleさんがコメントしている手書き文字認識以前に、業務用OCRソフトを使わないと、日付、品名、単価、数量、金額といった項目別に振り分けることができません。
ScanSnap自体は悪い商品ではありませんが、私はスキャナーとして販売すること自体が問題だと考えている製品です。一般のスキャナはTwainドライバを経由してソフトがスキャン画像を取り込めますが、ScanSnapは基本的にPDF経由でしかそれをさせません。一般のOCRソフトとの連携をうたっていますが、私が以前問い合わせたときに、「それって世間一般で連携というと思う?」と聞いたら回答に詰まりましたからね。
業務用OCRとなるとDynaEyeというPFUの製品もあることはあるので、将来対応する可能性が0とは言い切れませんが、お互いのコンセプトは全く別なので難しいでしょう。現時点で対応スキャナは業務用スキャナに限定されています。
ScanSnapで読み込んだPDFファイルを読み込んでOCRしてExcelにということとなると、ライブラリ製品が幾つか出ていることは出ていますので、作るという手が残されていますが、PDFを読み込むところからの開発となりますので、外注したら5~6百万かかるものと推測します。
手書き文字のOCRは、市販の技術では困難です。
AcrobatのOCR機能は優れているようなので試しても良いかと思います。
精度のレポート
http://www.ikurumi.com/article/132839208.html
もし、OCRが成功したら、PDF2Wordでテキストを抜き出せます。
コメント(2件)
手書きはほとんど認識できません。
活字でも綺麗な画像でないと誤認識します。