解像度は600x600dpi程度でスキャニング済です。
2000ページ程度分の画像を編集するため、あんましメンドいのは御免です。
フリーウェアで一括加工出来れば素晴しいです。MacOSX,
Windowsのどちらの環境で動くものでもかまいません。
ちょっとした加工程度では何も変わらないのであれば、はっきりそうおっしゃってください。
よろしくおねがいします。
他の質問では別の回答を書きましたが、学習機能付のOCRソフトなら、同一出版社の書籍を発行年次順に並べて繰り返している内に上がってきます。
やはり明朝体とは言え微妙に違うからでしょう。
書籍の場合、画像をトリミングするなど周囲、見開きの汚れ(なんて言うのでしょうか)と頁番号や章などのタイトルを消去してからOCRすると認識率が格段に違います。
メディアドライブさんに質問した時に始めて気が付いたのですが、e-Typistにしろ読んdeココにしろ元々1枚の紙をOCRするのが本来の使い方で書籍は苦手なようです。
書籍ということなので、まず
・影が出来やすいのでそれを消す
と言ったところから始めると良いかと思います。
特に、分厚い書籍になればなるほど本の「真ん中」の明度が足らず
薄暗くなります。OCRソフトには自動補正するものもありますが。
具体的手段ですが、グラフィックソフトでガンマかコントラストを
「くっきり側」に振ってください。ノイズがあまりに多い場合は
役に立たない方法ですが…自動化ソフトを使えば大量処理の自動化
も可能です。(ロケットマウスとかを想定して言ってます)
影云々はこちらの画像をご参照ください。
ちなみにこれからももし大量にスキャンされるのであれば、
↓のような専用機の購入もお勧めします。
やぁ、本はバラバラにしてスキャンしているので、基本的に影はないのですよ。
ところで偶然ですが、ブックスキャナー OpticBook3600 のページをさがしていたので、教えていただいてうれしかったです。すぐ製品の名前忘れるんですよね。
ロケットマウスってマウス自動で動くやつですよね?
そういうソフト使っても良いですね。
コニカミノルタ ブックスキャナ
http://konicaminolta.jp/products/business/micrographics/epicwin....
私もよく本からOCRするので、欲しいなぁ~とため息をつくばかりです。本の歪みや影なども補正するソフトがついてくるそうです。
これに近いのってデジカメで自作できんかな?
僕はScanSnapって言うのを使ってるんですが、裁断して本を捨てなくてはならない。本好きとしては少し悲しいところです。
他の質問では別の回答を書きましたが、学習機能付のOCRソフトなら、同一出版社の書籍を発行年次順に並べて繰り返している内に上がってきます。
やはり明朝体とは言え微妙に違うからでしょう。
書籍の場合、画像をトリミングするなど周囲、見開きの汚れ(なんて言うのでしょうか)と頁番号や章などのタイトルを消去してからOCRすると認識率が格段に違います。
メディアドライブさんに質問した時に始めて気が付いたのですが、e-Typistにしろ読んdeココにしろ元々1枚の紙をOCRするのが本来の使い方で書籍は苦手なようです。
>1枚の紙をOCRするのが本来の使い方で書籍は苦手なようです。
これすごく実感しています。
程々であきらめてさっさと校正作業した方が良いんでしょうね。
>1枚の紙をOCRするのが本来の使い方で書籍は苦手なようです。
これすごく実感しています。
程々であきらめてさっさと校正作業した方が良いんでしょうね。