また、ある程度の多機能性も欲しいです。
私がしたい事を具体的に言いますと、
十数冊の本の、「目次」と「索引」をスキャンした画像ファイル(.TIFF)を、
テキストデータにすることです。
目次と索引ですので、下記のように、
"……" 等の横線が、項目名の長さにより、違う長さで出てきます。
項目 ○○ ………… 52, 102
項目 ×××× …… 305
このような画像であっても、
自動的に項目名とページ数のつながり方を認識してほしいので、
ある程度の「多機能性」が欲しいのです。
しかし、「文字認識精度」か「多機能性」か、どちらかを採れと言われれば、
断然、「文字認識精度」です。
なぜなら、
画像内の文字の配置については、
前もって切り貼りしてからOCRにかければ良いですが、
誤認識がないか目で確認するのは、多量の労力が必要だからです。
以上、私のニーズに合ったOCRソフトをご存じの方、ご教示下さい。
長所・短所の簡単な解説をつけて下されば、なお結構です。
Windows7か8で動くものをお願いします。
有料・無料は問いません。高価なものでも良いです。
http://panasonic.co.jp/pstc/products/yomikaku/demo.html
Googleの無料のOCRですら、かなり強力です。
http://hokoxjouhou.blog105.fc2.com/blog-entry-373.html
それは、上のコメント「なぜですか?」へのご回答でもあるのでしょうか?
しかし、そうでなくとも、とても役に立つご助言です。有難うございます!