Adobe Acrobat9.0について質問です


Scansnapで文書等をスキャニングして、ActobatでOCRをあてて検索できるようにしています。
一方でAcrobatにはスキャンPDFの最適化機能があります。

そこで質問ですが、スキャンした文書にOCRを適用するとき、PDF最適化前と後では認識率に
違いはあるのでしょうか?

なおスキャンする条件やOCRの取り込み前提は同じものとします。

回答の条件
  • 1人2回まで
  • 登録:
  • 終了:2010/05/03 06:26:10
※ 有料アンケート・ポイント付き質問機能は2023年2月28日に終了しました。

ベストアンサー

id:Bombastus No.2

回答回数409ベストアンサー獲得回数52

ポイント48pt

Acrobat 9.0 Standardを使っています。


最適化によって、AcrobatのOCRがよく働くように、画像の歪みを補正したり、輪郭のシャープ化を行います。また、一般的にファイルサイズも小さくなるので、OCR前に最適化を施した方が認識率が高まります。

ただし例外があります。極端に大きなサイズの文字と小さな文字が同じページにあったり、横書きと縦書きが連続しているようなページでは最適化が失敗することが時々あります。

id:expansion05

なるほどわかりました!

確かに実験したときはフォントサイズの大小差が大きかったです

ありがとうございます

2010/05/02 18:22:16

その他の回答2件)

id:tama213 No.1

回答回数486ベストアンサー獲得回数30

ポイント32pt

>PDF最適化前と後では認識率に違いはあるのでしょうか?

ないか、最適化したほうが補正されるので、最適後のほうがOCR認識率が高くなります。

あくまで、印字された文字にたいしてであって、手書きの場合は不明です。

id:expansion05

印字文字の場合で結構です

やはり最適化後がいいのですか・・・一度前後で試してみたのですが気持ち最適化前のほうが読み込めていたので、他の方のご意見を伺いたかったのです

2010/05/02 18:05:49
id:Bombastus No.2

回答回数409ベストアンサー獲得回数52ここでベストアンサー

ポイント48pt

Acrobat 9.0 Standardを使っています。


最適化によって、AcrobatのOCRがよく働くように、画像の歪みを補正したり、輪郭のシャープ化を行います。また、一般的にファイルサイズも小さくなるので、OCR前に最適化を施した方が認識率が高まります。

ただし例外があります。極端に大きなサイズの文字と小さな文字が同じページにあったり、横書きと縦書きが連続しているようなページでは最適化が失敗することが時々あります。

id:expansion05

なるほどわかりました!

確かに実験したときはフォントサイズの大小差が大きかったです

ありがとうございます

2010/05/02 18:22:16
id:kick_m No.3

回答回数1372ベストアンサー獲得回数54

認識は主に解像度によるので、最適化してもあまり変わらないと思います。http://www

この質問への反応(ブックマークコメント)

「あの人に答えてほしい」「この質問はあの人が答えられそう」というときに、回答リクエストを送ってみてましょう。

これ以上回答リクエストを送信することはできません。制限について

回答リクエストを送信したユーザーはいません