ak2ey4回答ポイント 1000ptウォッチ 3

日本語OCRの中で、文字認識精度が最強のものを教えて下さい。

また、ある程度の多機能性も欲しいです。

私がしたい事を具体的に言いますと、
十数冊の本の、「目次」と「索引」をスキャンした画像ファイル(.TIFF)を、
テキストデータにすることです。

目次と索引ですので、下記のように、
"……" 等の横線が、項目名の長さにより、違う長さで出てきます。

項目 ○○ ………… 52, 102
項目 ×××× …… 305

このような画像であっても、
自動的に項目名とページ数のつながり方を認識してほしいので、
ある程度の「多機能性」が欲しいのです。

しかし、「文字認識精度」か「多機能性」か、どちらかを採れと言われれば、
断然、「文字認識精度」です。

なぜなら、
画像内の文字の配置については、
前もって切り貼りしてからOCRにかければ良いですが、
誤認識がないか目で確認するのは、多量の労力が必要だからです。

以上、私のニーズに合ったOCRソフトをご存じの方、ご教示下さい。
長所・短所の簡単な解説をつけて下されば、なお結構です。

Windows7か8で動くものをお願いします。
有料・無料は問いません。高価なものでも良いです。

※ 有料アンケート・ポイント付き質問機能は2023年2月28日に終了しました。
ログインして回答する

みんなの回答

この質問へのコメント

この質問への反応(ブックマークコメント)

質問の情報

登録日時
2014-06-08 20:24:04
終了日時
2014-06-15 20:25:04
回答条件
1人5回まで

この質問のカテゴリ

この質問に含まれるキーワード

windows71147OCR117TIFF70短所184索引30スキャン506

人気の質問

メニュー

PC版