スキャナで読み込んだ、新聞紙面をOCRでテキスト化したいです。
つきましては、誤認識の少ない、コスト対パフォーマンスの良いOCRソフトをご紹介ください。
1年前に質問者様と同様、OCRソフトの必要に迫られ、体験版を片っ端から試したことがありますので、参考までに。
きちんと設定(スキャン範囲・日本語/日英混在など)すれば、認識率は各社それほど違いはないように思いました。
簡単操作・1発変換、を売りにしている物よりは、少々込み入った設定ができるもののほうが、認識率を上げることができ、結果的に素早くスキャンできると思います。
私はこの点で、「読んde!! ココ」が良いと思い、購入しました。
どのOCRソフトでも修正は必要ですが、私はTXTで書き出してEmacsで編集しましたので、この点でどのソフトが優れているかは申し上げることができません。
まずは体験版を試されることをおすすめします。
また、高価な業務用OCRソフトも存在するようですので、予算が許すようならこちらも検討されてはいかがでしょうか。