スキャナで取り込んだ画像(本などの紙媒体の活字)を文字(テキストデータ)に解析できるソフト、というのがあると聞いたのですが、実際にはどれぐらいの価格の物で、また使用感(どの程度まで読み取り可能か)はどうなのでしょうか。詳しいデータ・情報などがあれば教えて頂きたいです。

回答の条件
  • URL必須
  • 1人2回まで
  • 登録:2005/08/19 21:33:54
  • 終了:--

回答(12件)

id:masahikokimoto No.1

masahikokimoto回答回数241ベストアンサー獲得回数102005/08/19 21:39:42

ポイント30pt

URLは商品比較の記事です。

いわゆるOCRソフトというもので、最近では1万~2万くらいでもそこそこのものが買えるようですね。

id:REBELLION

良い記事ですね、ありがとうございます。

2005/08/19 21:44:36
id:yuutanman2005 No.2

激安王回答回数46ベストアンサー獲得回数02005/08/19 21:44:19

ポイント30pt

http://pac.mediadrive.jp/support/entry/etem_up.html

MediaDrive:e.Typist エントリー - アップデータ・マニュアル ダウンロード

キャノンの機種であれば、このようなソフトが無料で付属されており、OCR機能を利用できます。最近のスキャナとソフトは性能がいいので、かなり高品質に読み取ることができます。


e.Typist エントリーというソフトです。

id:REBELLION

ありがとうございます。

2005/08/19 21:46:45
id:woodyone No.3

woodyone回答回数216ベストアンサー獲得回数32005/08/19 21:45:15

ポイント30pt

http://ai2you.com/shopai2you/ocr/koko11.asp

e�����@�ɁI�X�L���i/�f�W�^�������@/PDF�����p�I���F�����xOCR�w�ǂ�de!!�R�R Ver.12�x

「読んde!!ココ Ver.11 for Windows」です。

無料体験版をダウンロードしてみて、実際に試してみることをおすすめします。

http://ai2you.com/ocr/product/koko11/koko11ft.asp

id:REBELLION

読んde!!ココは以前にも考えた事がありました。ちょっと検討してみます。

2005/08/19 21:48:14
id:hinako17 No.4

hinako17回答回数74ベストアンサー獲得回数02005/08/19 21:47:24

ポイント30pt

http://panasonic.co.jp/pss/pstc/products/yomikaku/

日本語・英語活字カラーOCRソフト 「読取革命Ver.10」 | プロダクト&サービス | パナソニック ソリューションテクノロジー株式会社

このようなものでしょうか。


以前学校で使った覚えがありますが、どのようなソフトか忘れてしまいました。

認識率は80%程度だったと思います。

http://jyoppari.way-nifty.com/mobile/2004/02/ocr.html

じょっぱりモバイル道: テキスト化・OCR編【デジタルブック先取り計画】

上のソフトを使っている方の感想です。

id:REBELLION

そうです、OCRソフトの事です。なるほど。ありがとうございます。

2005/08/19 21:49:05
id:eruni-nyo No.5

eruni-nyo回答回数26ベストアンサー獲得回数02005/08/19 22:36:41

ポイント30pt

http://ai2you.com/ocr/

紙/名刺/PDF/文書の活用/管理/スキャナ/ソリューションを実現 A.I.SOFTの OCR製品総合サイト OCR WORLD

いわゆるOCRというソフトです。

取り込んだ画像を文字に変換してくれるのですが、認識率が悪く結構誤字や意味不明の物に変換されることがあります。

id:REBELLION

ありがとうございます。

2005/08/19 23:03:09
id:iwskR No.6

iwskR回答回数185ベストアンサー獲得回数182005/08/19 22:42:18

ポイント30pt

URLはダミーです。


OCRでの解析には精度に限界があり、

そのため使用目的によってはあまり役に立たないこともあります。

例えば、『印刷物の文章を一字一句間違えずにテキストにしたい(しなければならない)』

といった場合は、あまり役に立ちません。

誤字を含んだ文章から誤字を直していく作業というのは思った以上に大変で、見逃しもありえます。

ある程度のタイピング速度があれば全て一から打った方が早くて確実です。


OCRは、ざっとでいいからテキストデータにしたいというときに

使うものだということを覚えておいてください。

id:REBELLION

ははあ、ご意見ありがとうございます。まだ全体的にはそんなに精度は高くないと考えた方が良さそうですね。

2005/08/19 23:04:09
id:penguin-san No.7

penguin-san回答回数98ベストアンサー獲得回数02005/08/19 23:11:03

ポイント30pt

http://www.hatena.ne.jp/(-_-)/:detail]

ダミーです。すいません。

私は、一昨年キャノンのスキャナを購入したらOCRソフトが付属していましたのでそれを使用していますが、新聞紙のような黒っぽい再生紙を使用した英字の本をスキャンすると「l」や「I」や「i」と「1」を誤認したり、紙の汚れを「’」や「,」や「.」と誤認する事は、よくありますので後で必ず確認しないとダメです。

技術は、日々進歩しますし私の持っているOCRソフトが無料(一昨年のものだし)という事もあるのかもしれませんが・・・。

あまり日本語の本を取り込む機会が無いのではっきりとは言い切れませんが普通の白い綺麗な紙に書かれた日本語は、そんなに間違う事はないような気がします。

id:REBELLION

こういった実際に使ってみての感想は非常にありがたいです。ありがとうございます。

2005/08/19 23:15:42
id:taknt No.8

きゃづみぃ回答回数13539ベストアンサー獲得回数11982005/08/19 23:40:58

ポイント30pt

変換効率が90%の場合、100文字で10文字 変換できないということになります。

これが 1000文字だと 100文字。


こんなに 間違えてたら ちょっと使えないなという状況です。

ま、どっちにしろ 見直さないとダメですけどね。

http://www.ctec.fujitsu.com/services/archive/ocr/contrast.html

富士通コンピュータテクノロジーズ

http://www.geocities.jp/itsuoinada/HOR_index/Horabstract.htm

手書き・活字 英数字、数字文字認識エンジン

id:REBELLION

なるほど、参考になります。

2005/08/22 23:33:02
id:ke-pi No.9

けーピー回答回数278ベストアンサー獲得回数22005/08/20 00:15:01

ポイント30pt

http://www.itmedia.co.jp/pcupdate/articles/0508/04/news038.html

ITmedia PCUPdate�F�G�[�E�A�C�AWord�^Excel�Ή���OCR�\�t�g�̍ŐV�Ŕ���

こんなやつのことですよね?

実際使ったことないんですが便利そうですよねぇ

id:REBELLION

そうです、こういうのの事です。

書類なんかをデータ化するのに便利だろうなと思って。

2005/08/22 23:33:53
id:eisukem No.10

eisukem回答回数32ベストアンサー獲得回数02005/08/20 00:40:57

ポイント30pt

URLはダミーです。


私は趣味兼仕事で、よく国会議事録を読むのですが、かなり間違えが目立ちます。サイトによると、あなたがご希望のソフトを使っているようですが、あまり正確ではないようです。

ですから、iwskRさんのおっしゃるとおり、あくまでも参考といった場合のみに使うべきでしょう。


P.S. ご質問に対しての正確な解答ではないので、ポイントは不要です。

id:REBELLION

いえいえ、ありがとうございます。

なるほど、国会議事録でもOCRソフトを使っているんですか……。参考にちょっとどれぐらい間違いがあるのか見てみる事にします。

2005/08/22 23:35:07
id:nao-nao No.11

nao-nao回答回数1ベストアンサー獲得回数02005/08/21 07:21:44

ポイント30pt

「読んde!!ココ」のver10をたまに使用します。

印刷物であれば、かなりの精度で読み取り可能ですが、画像にドット「・」や髪の毛のような線が入っていると無理やりそれを「○」とか「し」に変換してめちゃくちゃになったりもします。(「願」を「原頁」と認識することもよくあります)


形式が統一されている印刷物(帳簿等)であれば、セル毎に文字種(ここは数字、ここは英字等)を設定して認識用の設定ファイルを作って、それを基に大量の画像を処理することが出来るはずです。(今手元にソフトがないので確認できてませんorz)

id:REBELLION

なるほど……そういう設定が出来るんですね。こういう実際に使っている方の意見は参考になります。ありがとうございます。

2005/08/22 23:36:04
id:mori-no-kumasan No.12

mori-no-kumasan回答回数47ベストアンサー獲得回数02005/08/22 02:23:25

ポイント30pt

https://www.justmyshop.com/app/servlet/item?item_code=2580715

Just MyShop − 一発!OCR Pro3 for 一太郎(製品の特長/動作環境・カタログ) −

一太郎用のOCRソフトですが、高性能です。値段も1万円程度で文字認識率は抜群です。HPで詳しく紹介されているので参考にしてください

id:REBELLION

生憎、使用しようとしている環境では一太郎は使用してないので残念です。後々一太郎を使うような環境になれば考えてみます。

2005/08/22 23:37:18

コメントはまだありません

この質問への反応(ブックマークコメント)

「あの人に答えてほしい」「この質問はあの人が答えられそう」というときに、回答リクエストを送ってみてましょう。

これ以上回答リクエストを送信することはできません。制限について

絞り込み :
はてなココの「ともだち」を表示します。
回答リクエストを送信したユーザーはいません