1158684771 大量の画像をOCRしてるんですが、だんだんうんざりしてきました。特に校正作業が大変で、ちょう飽きてきた。

それでそういう経験をした事がある人の体験談を聞きたいと思います。
元気な回答をくれた人には100とか200とかのポイントを差し上げます。元気のない人には50とか35とかのポイントだけど、あんまり元気がなさすぎると200とかになる。普通の人は10とか5とかそんくらいのポイントです。
それではよろしくお願いします。

回答の条件
  • 1人2回まで
  • 登録:2006/09/20 01:52:55
  • 終了:2006/09/22 21:52:31

ベストアンサー

id:aveguen No.3

aveguen回答回数15ベストアンサー獲得回数12006/09/20 03:03:38

ポイント60pt

OCRはホント嫌になりますね。

んで、OCRっつてもいろいろですが、専用系で無いと仮定して。

フラットベットスキャナでやってたらスキャンの時点で死にそうになり、以前は定期的に作業があったので、初期のscansnap(http://scansnap.fujitsu.com/jp/)を買ってみました。

結論。

「ま〜ま〜、やね〜」

スキャンは格段に楽になったけど・・・

対して精度上がらないんですね〜。

つまり、

日本語OCRはマダマダ

って結論で、基本は手の空いてる人に

「タイピスト」としてがんばってもらう事にしました。

その方が、校正楽なんだもん。

っつーか、結局早い(汗

あと、一人で寂しいときには、くだらんサイトを

ホームページ・リーダー(http://www-06.ibm.com/jp/accessibility/soft/hpr.html)で読み上げて笑ってる特殊な趣味の人間ですが(視覚障害者ではないんで「文字読め!」って話ですが)

読み上げツールで原稿を読み上げさせながら校正すると一人でも「読み合わせ」風味で寂しいです。。。

http://diary.noasobi.net/etc/aural_ua.html

いや、読み上げツールでの校正は時間はかかりますが便利ですよ。マジメに。

id:KotoriKoToriko

この元気は太字を使っている元気ですね。

読み上げかー、とりあえず70万文字くらいは終わったんだけども、あと80万文字くらいあるっぽいんで、耳が疲れそうです。

2006/09/20 03:41:36

その他の回答(9件)

id:toriaezu No.1

toriaezu回答回数119ベストアンサー獲得回数72006/09/20 02:12:02

ポイント32pt

一時期、会社でOCRを使っていたことがありましたけれども、はっきりいうとすぐにちょう飽きてました。

別にそれが仕事ではなかった、というのもあると思うんですけど。

 

今回はいい機会だったので、OCRについてざっくりと分析してみました。

 

  • OCRの目的とは?
    • 取り込んで電子化
    • データ管理
  • 何を電子化したい?
    • 文章とか
    • 画像とか
  • 誰がするの?
    • 自分でやる
    • 誰かにやってもらう

 

というわけでラクしたいのなら、業者に頼むのはいかがでしょうか。

http://www.july7.co.jp/pdf.html

http://www.phones.co.jp/07.html

http://www.japan-net.ne.jp/~kuma/ocr.html

まあ普通に高くてふざけんなって話ですけど。

 

で、やっぱり自分でやることになるわけですが、ここはやはりモチベーションだと思うんです。

僕が「仕事じゃないから」すぐに飽きてしまったのと同じように、

この作業をやることに「意味がない」と思わずに、この作業をやることで

「自分の作った画像が電子化されていって今後の創作活動にいい影響を与える!OCR最高!やったぜOCR!」

みたいな雰囲気を醸し出していけば、飽きずに続けられるのではないでしょうか。

 

参考になったかどうかはわかりませんが、最後は気持ちが大切だよ、という毒にも薬にもならない回答でした。

創作活動がんばってください。

id:KotoriKoToriko

この元気は普通くらいの元気ですね。

効率的な校正作業をちょっと考えてた。

毎日ビールばっかし飲んでるよ。

ハイネケンとモルツビールが好きー。

2006/09/20 02:45:22
id:makoron-P No.2

makoron-P回答回数32ベストアンサー獲得回数22006/09/20 03:01:19

ポイント10pt

urlはあてです。

http://wiki.livedoor.com/

友だちの名刺1000枚を入力するバイトをしたことがあります。

OCRソフトに読み込ませても、読み取り精度が低く、しかたなく手入力を行いました。

彼女がぐーぐー寝ているのを横目でみながら、暗い部屋で蛍光灯1つで、がんばって入力しました。

大変つらかったのですが、この仕事で起業できるかどうか、利益を出すにはどうしたらいいのかなど、経営者の視点で考えながら作業すると、ところどころで楽しさを感じる事ができました。

id:KotoriKoToriko

あれ、返信してなかったのかな?

この元気は考えながらの元気ですね。

OCR自体で利益を出すのは難しいけども、なんか出来るような気もしないでもない。

僕は蛍光灯よか豆球が好きです!

2006/09/22 21:47:11
id:aveguen No.3

aveguen回答回数15ベストアンサー獲得回数12006/09/20 03:03:38ここでベストアンサー

ポイント60pt

OCRはホント嫌になりますね。

んで、OCRっつてもいろいろですが、専用系で無いと仮定して。

フラットベットスキャナでやってたらスキャンの時点で死にそうになり、以前は定期的に作業があったので、初期のscansnap(http://scansnap.fujitsu.com/jp/)を買ってみました。

結論。

「ま〜ま〜、やね〜」

スキャンは格段に楽になったけど・・・

対して精度上がらないんですね〜。

つまり、

日本語OCRはマダマダ

って結論で、基本は手の空いてる人に

「タイピスト」としてがんばってもらう事にしました。

その方が、校正楽なんだもん。

っつーか、結局早い(汗

あと、一人で寂しいときには、くだらんサイトを

ホームページ・リーダー(http://www-06.ibm.com/jp/accessibility/soft/hpr.html)で読み上げて笑ってる特殊な趣味の人間ですが(視覚障害者ではないんで「文字読め!」って話ですが)

読み上げツールで原稿を読み上げさせながら校正すると一人でも「読み合わせ」風味で寂しいです。。。

http://diary.noasobi.net/etc/aural_ua.html

いや、読み上げツールでの校正は時間はかかりますが便利ですよ。マジメに。

id:KotoriKoToriko

この元気は太字を使っている元気ですね。

読み上げかー、とりあえず70万文字くらいは終わったんだけども、あと80万文字くらいあるっぽいんで、耳が疲れそうです。

2006/09/20 03:41:36
id:robbie21 No.4

robbie21回答回数34ベストアンサー獲得回数12006/09/20 05:21:37

ポイント10pt

私の場合。

ガーットスキャンして、ガーットテキスト化してガーット修正。

じゃなくて、一枚ずつ読み込んで、精度の上がるスキャンの設定を探しーの、OCRソフトの画面上で読み込んだ画面とつき合わせながら編集しーの、OCRソフトに活字の癖を覚えさせーの、ちまちまとやったほうが、だんだん作業が早くなって元気が増してきました。

そしてデカイ画面で作業すること。

id:KotoriKoToriko

この元気は真実味を帯びている元気ですね。

一枚ずつするって言うの、僕も考えたんだけど、どうしても続かなかった。やっぱし性格が重要なんだろうなー。

2006/09/20 11:26:32
id:KairuaAruika No.5

KairuaAruika回答回数6926ベストアンサー獲得回数972006/09/20 09:16:16

ポイント10pt

OCRソフトは,精度にかなりばらつきがあります。

原稿用紙等,フォーマットが決まっているものをスキャンする場合には効果が大きいものの,決まっていないものの場合は仰るとおり校正が大変です。

フォーマットがばらばらのものをスキャニングされているようでしたら,入力センターに発注してしまうのも手です。

全てテキストデータ化してくれます。

お金が掛かってしまうのが難しければ,全てをPDF化,をお勧めします。

コピーと同じなので,校正は全く必要ありません。

テキスト情報も,正確ではありませんが抽出してくれるスキャナもあるので,データベースとして検索も出来ます。

id:KotoriKoToriko

この元気は冷静な元気ですね。

だいたいOCR環境にスキャナとソフトで8万円くらいかかったので、外注しても良かったかなーと最近気付きました。

ここまで大変だとは思わなかった。

2006/09/22 21:48:13
id:Xegnyph No.6

Xegnyph回答回数66ベストアンサー獲得回数12006/09/20 09:57:55

ポイント72pt

OCRの校正..........

ほとんど拷問のような作業ですね。

効率化のためにOCRを使うのに、結局のところ人間が一字一句を見直さなければならないという矛盾。

「光学文字読取症候群~OCRシンドローム~」

長時間やっていると頭がボーーーーーっとしてきて、「あれっ?今、俺、何してた?」みたいになるんですよ。

校正ミスを頻発して叱られて目が覚める&自己嫌悪。

これが初期段階。

それを過ぎると、「記憶が抜けてるけど仕事はできてる」な状態になってきます。

時間はかなり経過していて原稿もかなり処理してる、しかもミスはほとんど無くて凄く効率が上がっている。

しかし気になるのはポッカリ記憶が抜け落ちてること。

目の下にクマができてるのに、なぜか疲労感はあまりない。

そういうのが中期。そろそろキケンな段階です。

この段階で十分な休息をとることができれば回復は可能です。

しかし、それでも休みが取れず同じような日々を繰り返していると、脳内物質が変容してきて苦痛を感じなくなっているんですね。

ナチュラルハイではなくトランス状態に近くなっています。しかも慢性。

むしろ、快感さえ覚えるようになってきます。

これが末期症状です。完全なOCRシンドロームです。

「色味の悪い原稿を見るとなぜかうれしい」

「多色刷りの原稿だと燃える(萌える)」

「変形フォントや異体字が楽しくてしょうがない」

「英数字だけの原稿だとガッカリしてしまう」

そう思うようになっていれば要注意です。

末期症状がさらに進行すると禁断症状が現れてきます。

休日でも自宅でも、もう何でも読み取って確認しなきゃ気がすまない。

自宅にもOCR用の機材があるが、いつ買ったか覚えていない。

週末には織り込みチラシを片っ端からOCR。

コンビニのコピー機など、フラットなガラス面を見ると汚れを確認せずにいられない。

もう常人に戻るのは困難です。

朝から晩までOCR。

職場でも自宅でもOCR。

平日も休日も、ずっとOCR。

憑かれたように繰り返し繰り返し繰り返し繰り返し・・・・・

そして、燃え尽きて廃人になってしまうのです。

まぁ冗談ですが、あり得ないとも言い切れないような、それぐらいキツい作業ですね。

自分が壊れない程度で頑張りましょう。

id:KotoriKoToriko

これはOCRやりすぎな元気ですね。

一週間程度でそこそこクオリティーの原稿を作りたいと思っています!中期目指したい!

2006/09/20 11:33:26
id:MC2 No.7

MC2回答回数77ベストアンサー獲得回数12006/09/20 10:06:42

ポイント10pt

ども、

まだ作業中でしょうか?

すごいたくさん作業しているときに、むかついてきて、自分の手をスキャンしてやったことがありました。

そしたら!!


読み取り部分に指紋がべったりついて、ぎゃーーーーーーーーーーーーーーーーーとなりました。

いたずらはしないようがいいですね。。

id:KotoriKoToriko

これはギャーッとなってる元気ですね。

ワンモア大量スキャンして、もう一度むかつこうよ!

そんでScanSnap買おうぜ!

ScanSnapは性能的には微妙なところもあるんだけども、最近珍しい使う人の事考えてる機械だと思います。

2006/09/20 11:31:19
id:KairuaAruika No.8

KairuaAruika回答回数6926ベストアンサー獲得回数972006/09/20 11:30:16

ポイント1pt

http://www.tnc-net.co.jp/

では是非当店へ!

id:KotoriKoToriko

これは現実的な元気ですね。

だいたい8万円(パソコン入れると16万円くらい?)かかったんだけども、予定では200万文字程度テキスト化する予定です。

そんで当店に頼むと僕の残金はマイナスになる気がする。とても残念だ!

2006/09/20 11:36:47
id:Totoro No.9

Totoro回答回数16ベストアンサー獲得回数12006/09/20 15:45:42

ポイント10pt

How to Make a Full Auto Book Scanner - a scientist's toy box

http://www.geocities.jp/takascience/lego/fabs_ja.html

大量のスキャン、大変そうですね。

私は膨大なスキャンはやった事はありませんが、膨大な住所録の登録を1ヶ月ほどやったことがあります。朝から晩まで登録ばっかり。

このときにカーソルキーを使わずにデータ入力する方法をマスターしました。↑でも誰か言っていましたが、何でもいいので目的を持ってやればよいかもしれない。

リンク先のように、自動読み取り機を作るのも面白そうです。

id:KotoriKoToriko

これはリンク先が元気な元気ですね。

僕は書籍をバラバラにして連続してスキャニングしているのですが、今のところ画像として読むというのが主流みたいです。

スキャニングよりも画像を文字に変換するのが大変なのです。

2006/09/21 02:11:19
id:Baku7770 No.10

Baku7770回答回数2832ベストアンサー獲得回数1812006/09/20 17:13:26

ポイント24pt

 一冊の本だけをOCRするために校正していると、飽きてくるので基本的に1冊だけをOCRするなんてことはしません。数冊の本を並行してOCRするようにしています。

 それでも気が付いたのは同じジャンルの本をOCRするとやはりやはり飽きる。そこで違うジャンルの本を選んでおいてOCRすると言うことですね。

 後、飽きないためには日々の計画を立てておいてどれだけ達成したかをチェックする。私はExcelの積み上げ棒グラフを使っています。

 もう一つのコツは、まず何ページOCRしなければならないか頁数をチェックする。さらに、先程の進捗と合わせて後何ページで完成だとやっていくとゴールが見えてくる内に楽しくなってきます。

 最後の楽しみは原文の誤字脱字を発見することです。一つ見つけると、著者や編集者より自分の方が賢いと思えてくるのが不思議です。

id:KotoriKoToriko

おーOCRな元気ですね。

僕はどちらかというと一分野ずつしちゃうんですが、それが悪かったのかもしれない。

成果を認識するのは、OCRに限らず良いかもしれない。

2006/09/21 02:14:24

この質問への反応(ブックマークコメント)

トラックバック

「あの人に答えてほしい」「この質問はあの人が答えられそう」というときに、回答リクエストを送ってみてましょう。

これ以上回答リクエストを送信することはできません。制限について

絞り込み :
はてなココの「ともだち」を表示します。
回答リクエストを送信したユーザーはいません