日本語OCRされた場合に､最も認識率の高いﾌｫﾝﾄの名前､またはその条件について教えて下さい｡ US-ASCIIに含まれる文字でOCRに適しているﾌｫﾝﾄと言えば､当然ながらO…

日本語OCRされた場合に､最も認識率の高いﾌｫﾝﾄの名前､またはその条件について教えて下さい｡

US-ASCIIに含まれる文字でOCRに適しているﾌｫﾝﾄと言えば､当然ながらOCR-Bであって､考えるまでもないことですが､日本語のﾌｫﾝﾄについてはどうでしょうか｡

つきましては､もし､OCRされるのに適したﾌｫﾝﾄとしてすでに知られている物があるとすれば､そのﾌｫﾝﾄを教えて下さい｡

あるいは､もし､そのようなｽﾀﾝﾀﾞｰﾄﾞとされるﾌｫﾝﾄが無い(又は､失礼ながら､ご存じない)とすれば､そのﾌｫﾝﾄの｢条件｣について教えて下さい｡ただしその場合､｢多分◯◯だろう｣という全くの憶測に拠るご回答はご遠慮ください(ただし､OCRｼｽﾃﾑの専門家の方がいらっしゃるとすれば､｢OCRの原理上は◯◯であることが重要だ｣のようなご回答は､歓迎いたします)｡多少なりともで結構ですので､ある程度､実証または実験の結果としてのﾃﾞｰﾀがあるご回答をお願い申し上げます｡

よろしくご教示のほどお願い申し上げます｡

自炊用OCRですか？
http://d.hatena.ne.jp/TipsMemo+computer-technology/20150201/p2

結局､元ﾃﾞｰﾀにより合うｿﾌﾄを選ぶことがﾍﾞｽﾄです｡
http://www.vector.co.jp/vpack/filearea/win/hardware/scan/ocr/
には手書き数字のみに特化したOCRなどがあります｡
逆に原稿をつくるときにﾌｫﾝﾄを選べるのなら通常OCRは不要です｡

通常のﾌｫﾝﾄ(POPなどではなく)で白地に黒で印刷した300dpi以上の
未圧縮(jpgでなくpngなど)原稿があれば
現代の大体の日本語OCRはおそらく
99％以上認識できる能力がありますが､
そのような文書はたったA4の20ﾍﾟｰｼﾞで2ｷﾞｶﾞを越えるなど大容量になります｡
自炊なら20ﾍﾟｰｼﾞからつくった2ｷﾞｶﾞからﾃｷｽﾄを読んだらすぐ消して､
またすぐｽｷｬﾝすればいいんですけどね｡

で､解像度がすこしでも下がると､まずｾﾘﾌﾌｫﾝﾄや明朝体の美しさ･可読性を示す部分が
OCRｿﾌﾄに対しては悪さを始めます｡
端的にいうと文字区切りが曖昧になります｡uをaと読むようになったりします｡

OCR?Bをご存じならｺﾞｼｯｸがよいというのも説明するまでもなく
理解されるのではないかとおもいましたが｡
おそらくMS?ｺﾞｼｯｸ(Pでない等幅)かﾒｲﾘｵの､(昔のﾜｰﾄﾞのﾃﾞﾌｫﾙﾄでつくったような)字間のあいている原稿はもっとも読みやすいでしょう｡
ｿﾌﾄを調教できないのでそれでも｢ﾃﾞｺｲ衣装｣の中に依があらわれることは避けられないかもしれません｡

しかし現代の日本語ﾌｫﾝﾄは可読性のみならずﾃﾞｻﾞｲﾝのためにさまざまに加工されています｡
統一するなら･出来るならﾃﾞﾌｧｸﾄｽﾀﾝﾀﾞｰﾄﾞのﾒｲﾘｵがいいとなるでしょうね｡

質問者さんのお使いになるOCRｿﾌﾄ､ｽｷｬﾅｰとの相性があると思われます｡

比較2015’ 現行の日本語OCRｿﾌﾄ3機種の性能とおすすめ

OCR専用ｿﾌﾄではWindowsやMac上の標準ﾌｫﾝﾄに対してはﾃｽﾄを繰り返し行っているでしょうから Windowsでは等幅ｺﾞｼｯｸ,MacではOsaka?等幅あたりのﾌｫﾝﾄが認識率が最も高くなると思います｡

等幅ﾌｫﾝﾄを選択しているのは字間ｽﾍﾟｰｽが固定なため OCRｿﾌﾄでの文字抽出率低下が減るという理由です｡

文字認識ｼｽﾃﾑShrift

>P26. 実装のｺﾝｾﾌﾟﾄここで切ってしまいそう文字抽出実際問題難しい

ただしﾌｫﾝﾄｻｲｽﾞが小さくなり印刷ﾎﾟｲﾝﾄｻｲｽﾞが小さくなってくると､
画数の多い漢字などは印刷が省略形になるとか､小さな印刷ﾌｫﾝﾄをｽｷｬﾝすると十分な解像度で取り込みできるかの保証がない､などの条件が加わりますので十分大きなﾌｫﾝﾄ限定でという制限内でのお話になりますね｡