PDFに記載されている数字を、データ(エクセル)にしたいのですが、OCRだけに頼ると万が一のミスに気づけないことに悩んでいます。


数字の書類は莫大な金額ですので、誤りは絶対起こせません。

そこでOCRでかんたんに数字化を終えてしまうのではなく、どこかで人的な確認の入るような形にしたいと考えています。

イメージでは、携帯メールの予測変換のように候補が何件かでてきて、文字と思われるものをデータ化するときに列ごとに合ってるか聞いてくるようなソフトがいいな~と思っています。

「この列があってたらENTER押して次の列」みたいなOCRソフトです。

全部が全部機械任せではなく人的許可を出しながら進んでいけるようなソフトがありましたら教えていただきたいです。

また一括変換だったとしても人的な確認方法を手助けするようなツール提案を募ります。

何卒よろしくお願いいたします。

回答の条件
  • URL必須
  • 1人2回まで
  • 13歳以上
  • 登録:2010/03/04 02:28:28
  • 終了:2010/03/11 02:30:02

回答(3件)

id:km1967 No.1

km1967回答回数541ベストアンサー獲得回数402010/03/04 06:56:24

ポイント27pt

読んde!!ココ Ver.13

読んde!!ココ Ver.13

  • 出版社/メーカー: エー・アイ・ソフト
  • 発売日: 2007-02-23
  • メディア: CD-ROM

いったん認識結果を表示してから確定することができる

id:mamakazu

ありがとうございます。

以前に起こした間違いを正しいほうに登録できる」や「透明フィルター」がよさようだな~と思いました。

今までOCRを使おうという案に至ったことは何回もありますが、実際に使ったことは1回もなく・・・試験版を試してみたいと思いました。

ありがとうございます。

2010/03/04 19:44:02
id:h_kondo No.2

h_kondo回答回数33ベストアンサー獲得回数32010/03/04 23:15:52

ポイント27pt

PDF内のテキストデータはadobereaderの「ファイルメニュー」=>「テキストとして保存」を使用すればよいと思います。

ただし、保護された(印刷禁止)になっているPDFでは「テキストとして保存」はグレー表示で機能しません。

http://help.adobe.com/ja_JP/Reader/8.0/help.html?content=WS58a04...

というわけで「テキストとして保存」をお試しください。

id:mamakazu

ありがとうございます。

ためしてみます。

2010/03/06 01:52:09
id:Km1967 No.3

Km1967回答回数224ベストアンサー獲得回数352010/03/05 04:59:43

ポイント26pt

いきなりPDF to Data 7

いきなりPDF to Data 7

  • 出版社/メーカー: ソースネクスト
  • 発売日: 2009-07-03
  • メディア: CD-ROM

PDFによってはOCRよりこちらのほうがよい場合がある

id:mamakazu

なるほどですね。

調べてみます!!

ありがとうございます。

2010/03/06 01:52:37

コメントはまだありません

この質問への反応(ブックマークコメント)

「あの人に答えてほしい」「この質問はあの人が答えられそう」というときに、回答リクエストを送ってみてましょう。

これ以上回答リクエストを送信することはできません。制限について

絞り込み :
はてなココの「ともだち」を表示します。
回答リクエストを送信したユーザーはいません