アドビのAcrobat.com.com利用しましたが、誤字脱字だらけで使い物になりませんでした。
実際にやっておられる方の方法が知りたいです。
元がOCRだったら、そのPDFの埋め込みテキストがすでに違っている(認識率が低い)ことになりますね。であれば、もっと認識率が高いOCRソフトでもう一度認識からやり直すしかないのでは?もっとも、プリンタに付属するOCRソフトはそんな極端にひどいものではないはず(たいていは90%中盤から後半)なので、体験版がそれに勝るとは考えにくいですが。ぶっちゃけ認識率が60%なんてクソだと言えます。冷静に考えてください。60%というと、100文字認識させたら正解が60文字そこそこしかないってことですよ?40文字近くも間違ってる。ボロボロじゃないですか。
もし今の埋め込みテキストがそんなにひどいなら、元文書を作ったところにやり直しを依頼した方が良さそうな予感がします。元文書の画質が低いと、どんなOCRを使っても認識率は上がりませんので、もっと解像度を上げたらどうだろうと言うのが真っ先に思いつく点です。が、元文書がすでに汚い(ファクスで流れてきたものだったり、何世代コピーされたか解らないもの)では、おそらく何をやっても無駄な抵抗に終わりそうですが。
基本的に元文書次第のところがあると思います。(画像化されていたり、段組上の問題があったり、暗号化されていたり、、、と。)
当方は分量が少なければ、コピー&ペーストでテキストエディタに貼り付けています。(量が多ければ、フリーソフトから適当なものを選んで使用。)