「読み取り革命」というOCRソフトを試しに使ってみました。スキャナー(シャープ MX3501FN)が悪かったのか、識字率が悪かったために手入力とあまり時間はかからなかったです。
何か良いソフトか方法があれば教えてください!
よろしくお願いします。
●OCRはその性質上、
・「−」と「ー」
・「ば」と「ぱ」
・「ら」と「う」
・「っ」と「つ」
・「巳」と「己」と「已」
・「1」と「I」と「l」
・「a」と「α」
などの文字を誤認識しやすいこと、誤認識した文字の修正は(IMでの誤変換と比べて)見つけにくく、単漢字変換を使っての修正が面倒くさいなどのデメリットがあります。
●また、名刺には企業ロゴが入っていたり、文字に長体、平体のかかっていることの多いので、OCRは向いていません。OCRの利用は考えない方がいいと思います。
【お勧めする対応】
・名刺はスキャンして、重要な情報のみ手入力してデータベース化、必要な情報は適時入力する。
【その方法】
1)名刺を横2×縦5列にして、セロファンテープなどで連結する(A4に収まります)。
2)グレースケール(またはカラー)200dpiでスキャンする。
スキャンした画像には3桁の連番を振っていきます(A001、A002、A003…)。
3)スキャンした画像の左上から左下、右上から右下へと仮想的に番号を振っていきます。
4)スキャンした画像から、最低限必要な情報(社名、個人名)を抜き出して、Excelやエディタに入力していきます。
5)一通り入力が終わったら、重要な名刺から、二次的に必要な情報(所在地や役職、読み方など)を抜き出してデータ化していきます。
6)名刺は一定期間経過したら処分します。
【この方法のポイント】
・なかば機械的に処理することができる。
・情報の重要さに軽重をつけられる(飛び込みでやってきた営業さんの名刺まで完全データ化する必要はありませんよね)。
・ある名刺がデータ化したかどうか確認しやすい(10枚に連結した名刺=スキャン済み)。
・スキャンした画像から入力するので、スキャンミスがあれば早期にわかる。
・入力間違いがあってもスキャン画像で確認することができる。
【やってはいけないこと】
・読み仮名をExcelまかせにしてはいけない(単漢字変換していたら間違う)。
・すべての名刺から、すべての情報を抜き出そうとしてはいけない(手間がかかる割に、使わない情報まで入力してしまう)。
・最初に名刺を50音順などで整理しようとしてはいけない(データ化してしまえばいつでもできる)。
・画像を名刺単位で切り抜こうとしてはいけない(10枚同時に表示できるメリットは大きい)。
●手間とメリットのバランスを考えると、これが最適だと思います。
http://q.hatena.ne.jp/1184837429(URLはダミーです)
スキャナde!! 名刺整理:価格:5,040円~31,290円
名刺ブレーン:価格:23,940円
どちらも専用カラースキャナーがつきます。名刺に特化していて、そんなに高いものでもないので検討されてはいががでしょうか。
ありがとうございます!
管理することを目的にすると確かに良い方法だと思います。
データベース化した後に同包メールで一括送信しようと考えているので、やはりエクセルのようなものに落とす必要があるんです。