人力検索はてな
モバイル版を表示しています。PC版はこちら
i-mobile

大量の画像をOCRしてるんですが、だんだんうんざりしてきました。特に校正作業が大変で、ちょう飽きてきた。
それでそういう経験をした事がある人の体験談を聞きたいと思います。
元気な回答をくれた人には100とか200とかのポイントを差し上げます。元気のない人には50とか35とかのポイントだけど、あんまり元気がなさすぎると200とかになる。普通の人は10とか5とかそんくらいのポイントです。
それではよろしくお願いします。

1158684771
●拡大する

●質問者: KotoriKoToriko
●カテゴリ:コンピュータ 人生相談
✍キーワード:OCR うんざり だんだん ポイント 体験談
○ 状態 :終了
└ 回答数 : 10/10件

▽最新の回答へ

1 ● toriaezu
●32ポイント

一時期、会社でOCRを使っていたことがありましたけれども、はっきりいうとすぐにちょう飽きてました。

別にそれが仕事ではなかった、というのもあると思うんですけど。

今回はいい機会だったので、OCRについてざっくりと分析してみました。

というわけでラクしたいのなら、業者に頼むのはいかがでしょうか。

http://www.july7.co.jp/pdf.html

http://www.phones.co.jp/07.html

http://www.japan-net.ne.jp/~kuma/ocr.html

まあ普通に高くてふざけんなって話ですけど。

で、やっぱり自分でやることになるわけですが、ここはやはりモチベーションだと思うんです。

僕が「仕事じゃないから」すぐに飽きてしまったのと同じように、

この作業をやることに「意味がない」と思わずに、この作業をやることで

「自分の作った画像が電子化されていって今後の創作活動にいい影響を与える!OCR最高!やったぜOCR!」

みたいな雰囲気を醸し出していけば、飽きずに続けられるのではないでしょうか。

参考になったかどうかはわかりませんが、最後は気持ちが大切だよ、という毒にも薬にもならない回答でした。

創作活動がんばってください。

◎質問者からの返答

この元気は普通くらいの元気ですね。

効率的な校正作業をちょっと考えてた。

毎日ビールばっかし飲んでるよ。

ハイネケンとモルツビールが好きー。


2 ● makoron-P
●10ポイント

urlはあてです。

http://wiki.livedoor.com/

友だちの名刺1000枚を入力するバイトをしたことがあります。

OCRソフトに読み込ませても、読み取り精度が低く、しかたなく手入力を行いました。

彼女がぐーぐー寝ているのを横目でみながら、暗い部屋で蛍光灯1つで、がんばって入力しました。

大変つらかったのですが、この仕事で起業できるかどうか、利益を出すにはどうしたらいいのかなど、経営者の視点で考えながら作業すると、ところどころで楽しさを感じる事ができました。

◎質問者からの返答

あれ、返信してなかったのかな?

この元気は考えながらの元気ですね。

OCR自体で利益を出すのは難しいけども、なんか出来るような気もしないでもない。

僕は蛍光灯よか豆球が好きです!


3 ● aveguen
●60ポイント ベストアンサー

OCRはホント嫌になりますね。

んで、OCRっつてもいろいろですが、専用系で無いと仮定して。

フラットベットスキャナでやってたらスキャンの時点で死にそうになり、以前は定期的に作業があったので、初期のscansnap(http://scansnap.fujitsu.com/jp/)を買ってみました。

結論。

「ま〜ま〜、やね〜」

スキャンは格段に楽になったけど・・・

対して精度上がらないんですね〜。

つまり、

日本語OCRはマダマダ

って結論で、基本は手の空いてる人に

「タイピスト」としてがんばってもらう事にしました。

その方が、校正楽なんだもん。

っつーか、結局早い(汗

あと、一人で寂しいときには、くだらんサイトを

ホームページ・リーダー(http://www-06.ibm.com/jp/accessibility/soft/hpr.html)で読み上げて笑ってる特殊な趣味の人間ですが(視覚障害者ではないんで「文字読め!」って話ですが)

読み上げツールで原稿を読み上げさせながら校正すると一人でも「読み合わせ」風味で寂しいです。。。

http://diary.noasobi.net/etc/aural_ua.html

いや、読み上げツールでの校正は時間はかかりますが便利ですよ。マジメに。

◎質問者からの返答

この元気は太字を使っている元気ですね。

読み上げかー、とりあえず70万文字くらいは終わったんだけども、あと80万文字くらいあるっぽいんで、耳が疲れそうです。


4 ● robbie21
●10ポイント

私の場合。

ガーットスキャンして、ガーットテキスト化してガーット修正。

じゃなくて、一枚ずつ読み込んで、精度の上がるスキャンの設定を探しーの、OCRソフトの画面上で読み込んだ画面とつき合わせながら編集しーの、OCRソフトに活字の癖を覚えさせーの、ちまちまとやったほうが、だんだん作業が早くなって元気が増してきました。

そしてデカイ画面で作業すること。

◎質問者からの返答

この元気は真実味を帯びている元気ですね。

一枚ずつするって言うの、僕も考えたんだけど、どうしても続かなかった。やっぱし性格が重要なんだろうなー。


5 ● KairuaAruika
●10ポイント

OCRソフトは,精度にかなりばらつきがあります。

原稿用紙等,フォーマットが決まっているものをスキャンする場合には効果が大きいものの,決まっていないものの場合は仰るとおり校正が大変です。

フォーマットがばらばらのものをスキャニングされているようでしたら,入力センターに発注してしまうのも手です。

全てテキストデータ化してくれます。

お金が掛かってしまうのが難しければ,全てをPDF化,をお勧めします。

コピーと同じなので,校正は全く必要ありません。

テキスト情報も,正確ではありませんが抽出してくれるスキャナもあるので,データベースとして検索も出来ます。

◎質問者からの返答

この元気は冷静な元気ですね。

だいたいOCR環境にスキャナとソフトで8万円くらいかかったので、外注しても良かったかなーと最近気付きました。

ここまで大変だとは思わなかった。


1-5件表示/10件
4.前の5件|次5件6.
関連質問


●質問をもっと探す●



0.人力検索はてなトップ
8.このページを友達に紹介
9.このページの先頭へ
対応機種一覧
お問い合わせ
ヘルプ/お知らせ
ログイン
無料ユーザー登録
はてなトップ