日本語OCRの中で、文字認識精度が最強のものを教えて下さい。

Question

ak2ey4

152

143もっと見る

1000pt

コンピュータ科学・統計資料

日本語OCRの中で、文字認識精度が最強のものを教えて下さい。

また、ある程度の多機能性も欲しいです。

私がしたい事を具体的に言いますと、
十数冊の本の、「目次」と「索引」をスキャンした画像ファイル（.TIFF）を、
テキストデータにすることです。

目次と索引ですので、下記のように、
"……" 等の横線が、項目名の長さにより、違う長さで出てきます。

項目 ○○ ………… 52, 102
項目 ×××× …… 305

このような画像であっても、
自動的に項目名とページ数のつながり方を認識してほしいので、
ある程度の「多機能性」が欲しいのです。

しかし、「文字認識精度」か「多機能性」か、どちらかを採れと言われれば、
断然、「文字認識精度」です。

なぜなら、
画像内の文字の配置については、
前もって切り貼りしてからOCRにかければ良いですが、
誤認識がないか目で確認するのは、多量の労力が必要だからです。

以上、私のニーズに合ったOCRソフトをご存じの方、ご教示下さい。
長所・短所の簡単な解説をつけて下されば、なお結構です。

Windows7か8で動くものをお願いします。
有料・無料は問いません。高価なものでも良いです。

回答の条件

1人5回まで

登録：2014/06/08 20:24:04
終了：2014/06/15 20:25:04

※ 有料アンケート・ポイント付き質問機能は2023年2月28日に終了しました。

nazeka2014 2014/06/10 22:12:40

上記に上がっているe.Typistを持ってたけど，もう使用していない。理由はわかるよね？
ak2ey4 2014/06/12 13:54:45

nazeka2014さん、なぜですか？
yoshinon 2015/09/16 04:58:21

残念ながら最近、フリーのものと有料のものの性能差が、ほぼなくなりつつあります。
Googleの無料のOCRですら、かなり強力です。
http://hokoxjouhou.blog105.fc2.com/blog-entry-373.html
ak2ey4 2015/09/16 22:53:13

yoshinon (id:yoshinon) 様、

それは、上のコメント「なぜですか？」へのご回答でもあるのでしょうか？

しかし、そうでなくとも、とても役に立つご助言です。有難うございます!

「あの人に答えてほしい」「この質問はあの人が答えられそう」というときに、回答リクエストを送ってみてましょう。

これ以上回答リクエストを送信することはできません。制限について

リクエスト送信済

回答リクエストを送信したユーザーはいません

snow0214 · Answer 1 · 2014-06-08T21:15:27+09:00

パナソニック読取革命Ver.15 製品版

出版社/メーカー: パナソニック
発売日: 2012/09/21
メディア: CD-ROM
クリック: 57回
この商品を含むブログを見る

無料体験版ダウンロード

http://panasonic.co.jp/pstc/products/yomikaku/demo.html

参考記事：比較2014' 現行の日本語OCRソフトの性能評価・おすすめ

http://monomania.sblo.jp/article/55737163.html

エネゴリ · Answer 2 · 2014-06-08T23:21:39+09:00

ABBYY FineReader12（体験版）
http://finereader.add-soft.jp/
主な特徴
http://www.unipos.net/find/product_item.php?id=64

・99.8%の言語認識精度
・文書レイアウトの保存機能
(グラフ、図表、テキスト列、イメージ、テーブルなど)
・190種類の言語を認識、48種類の言語における辞書機能
・カスタムユーザー辞書
・フォントの保存
・豊富な出力フォーマットをサポート
(Microsoft Word、Excel、PowerPoint、Adobe Acrobat、Corel、WordPerfect、OpenOffice.org Writerなどに直接送信できます)

gizmo5 · Answer 3 · 2014-06-09T00:09:44+09:00

電子書籍自炊 | PDF作成に最適な活字OCRソフト | e.Typist v.15.0：トップ

http://ascii.jp/elem/000/000/721/721112/index-2.html

思った以上にOCRソフトは使える！
ルビのない原稿なら誤認識は実質わずかに0.04％

　1ページ目から1万文字ぶんの原稿とOCR変換したデータを精査したところ、誤変換は63ヵ所。ほとんどが、「二」や「……」「。」の誤認識だった。「草鞋」を「草鮭」、「花崗岩」を「花]岡石」とするなどのミスは3～4ヵ所あった。ルビは165ヵ所あり、ミスは90ヵ所。そのほとんどが、1行に複数のルビがあるためにくっついたもの。文字の認識ミスは10ヵ所程度だった。

　ルビのない原稿なら、高い確率で認識してくれることがわかった。本文の誤認識は0.6％、実質的には0.04％といったところだ。

kanonk · Answer 4 · 2014-06-09T08:45:30+09:00

ABBYY FineReader ® 12

http://finereader.add-soft.jp

ABBYY FineReader 12 は、スキャンした文書、PDF、デジカメやiPhone、スマートフォンで撮影した画像などを、
高い精度で読み取り、検索／編集可能なフォーマットに変換できる総合 OCR ソフトウェアです。
変換可能な形式には、Microsoft® Word、Excel、検索可能な PDF、および一般的な電子書籍フォーマットが含まれます。
ABBYY FineReader 12 は 190 の言語に対応しています。

TransFreeBSD · Answer 5 · 2014-06-09T13:07:58+09:00

OCRといえば宛名認識といえば東芝、と思ったので下記をあげてみる。
使ったことないのですが。

ExpressReader Pro
http://www.toshiba-sol.co.jp/pro/ocr/erpro/index_j.htm
値段が桁違いな分はさすがに性能は上なんじゃないかと思う。
でも、活字だとオーバースペックかも。
こういう価格帯もあるよという事で出してみました。

日本語OCRの中で、文字認識精度が最強のものを教えて下さい。

回答（5件）

snow02144701162014/06/08 21:15:27

無料体験版ダウンロード

参考記事：比較2014' 現行の日本語OCRソフトの性能評価・おすすめ

エネゴリ13761562014/06/08 23:21:39

gizmo55041412014/06/09 00:09:44

電子書籍自炊 | PDF作成に最適な活字OCRソフト | e.Typist v.15.0：トップ

kanonk327162014/06/09 08:45:30

TransFreeBSD6682682014/06/09 13:07:58

コメント（4件)

この質問への反応（ブックマークコメント）

日本語OCRの中で、文字認識精度が最強のものを教えて下さい。

回答（5件）

snow02144701162014/06/08 21:15:27

無料体験版ダウンロード

参考記事：比較2014' 現行の日本語OCRソフトの性能評価・おすすめ

エネゴリ13761562014/06/08 23:21:39

gizmo55041412014/06/09 00:09:44

電子書籍 自炊 | PDF作成に最適な活字OCRソフト | e.Typist v.15.0：トップ

kanonk327162014/06/09 08:45:30

TransFreeBSD6682682014/06/09 13:07:58

コメント（4件)

この質問への反応（ブックマークコメント）

電子書籍自炊 | PDF作成に最適な活字OCRソフト | e.Typist v.15.0：トップ