URLは今回はあんまり関係ないです。
ゼロとオー、アイとイチの読み違えを完全学習させることは難しいです(値段の問題ではなく、そういうものなのです)
OCRのみでの変換作業ならば、変換間違いはどうするかをしっかりと事前打ち合わせしておくか、もしくは人間の目による確認を必須とするしか手はありません。
納品ということは読取を仕事として請け負っているのでしょうから、そのあたりは事前にハッキリとしておくのが常識であり、もしも現在クレームが来ているのであれば自腹を切って人を雇ってでも対応するしかないでしょう。
http://software.fujitsu.com/jp/ocr/socr/
表OCR/文書OCR for Excel&Word : 富士通
WORD,EXCEL用ですが、こちらはいかがでしょうか。認識サンプルがサイトにあるので、確認されてみては?
http://pac.mediadrive.jp/wrp/index.html
電子文書化に最適な活字OCRソフト | WinReader PRO v.12.0 | トップ
多少高くてもよいとのことですので昔からあるwinreaderはどうでしょう。これだけ高ければ業者がやってきてデモぐらいしてくれると思いますが。
業界最高水準を謳っている「読んでココ」の体験版がありますので、お試しになってはいかがでしょう?
メディアドライブ株式会社 | OCRソフト開発販売、画像や文書の分類・検索技術
コチラの製品は種類が多いのですが、
認識率は高いと思います。
ご検討ください。
以降は処理する文書の種類、使用しているソフト名、処理の量がわかると回答しやすいと思います。
私の場合は、認識結果をエディタで修正しています。
まず、読んde!!ココで認識して、数字と英字は色分けされるので、ある程度修正します。
次に、エディタに取り込んで(英文の場合)スペルチェックして、さらに、検索、置換機能を利用して修正します。(もし、レイアウトなどを行う必要があればワープロで整形します。)
エディタを使うのは、動作が軽いことと、文字種(特定の文字列も)によって色分けができる点です。
リンクはEmEditorですが、秀丸のほか高機能なものは多数あります。
ありがとうございます。試してみます。