OCRで自動読みとりさせる仕様を検討しているのですが
文字種別で「0」と「O」、「1」と「I」等、数字と英字が似てたり
「V」と「U」のように英字が似通っていたりと、
OCRで誤読しそうなものをあらかじめ省いてある文字セットがあると
きいたのですが、どのようなものがあるか、ご存じないでしょうか?
http://www.webstore.jsa.or.jp/
JSA Web Store
URL は日本規格協会の仕様書販売サイト(仕様詳細はこちらで購入可能)
お探しのものは、おそらく、次にあげる規格に含まれるかと思います。
JIS X 9001:1976 光学式文字認識のための字形(英数字)
JIS X 9003:1980 光学式文字認識のための字形(片仮名)
JIS X 9004:1983 光学式文字認識のための印字仕様
JIS X 9005:1979 光学式文字認識のための手書き文字(片仮名)
JIS X 9006:1979 光学式文字認識のための手書き文字(数字)
JIS X 9007:1981 光学式文字認識のための手書き文字(英字)
JIS X 9008:1981 光学式文字認識のための手書き文字(記号)
JIS X 9009:1991 光学式文字認識のための手書き文字(平仮名)
仕様に対応した製品を探すということであれば、上記サイトで買う必要はなく、いずれかの検索エンジンで、例えば ”JIS X9007” で検索して見つけることもできるかと思います。
http://www.flashbackj.com/ocr-b/
バーコード作成の必需品・JIS準拠のOCR-Bフォント:FLASHBACK OCR-B FONT
条件とは異なりますが,OCRを確実に行いたい場合,印字にOCR-Bフォントを使用します.印字指定が可能であればOCR-Bフォントによる印字を指定すればよいのではないでしょうか?
バーコード印字も必要なのでつかわうこと検討します
OCRの限界が99.8%という数字はご存知でしょうか。1000字あれば2文字は確実に誤認識してくれます。これは活字で新しく印刷された紙上の文字に対する数字で、実際は汚れやかすれによって、より高くなってきます。
業務用のOCRで認識率の高いのは住所データです。これは郵便番号との突合せが行えるからです。
それを弾くシステムの構築は充分可能で、商品マスターに誤読される可能性の高いコードも持たせるとか、そのようなデータは画像と突合せるといった工夫も必要です。
コードセンターの設置と商品コードにチェックデジット的な意味合いも含ませるなどの工夫をされてもいいでしょう。
すごい情報量で処理しきれません。よみこなしてみます
http://www.tbs.gol.com/4925187104.html
東京文献センター 古きを尋ねるシリーズ1 古きを訪ねる銚子の絵はがき ISBN4-925178-10-4
OCRフォントでしょうか
<参考>
書籍(バーコードのしたの文字等)で
使われているのは「OCR-B」というフォントです。
標準仕様がやはりあるのですね。
助かりました。