GoogleやYahooが図書館のデータを電子化していますが、どのようにやっているのでしょうか?


もし人手を使ってストレートにテキスト化しているとしたら一冊~万円かかるでしょうから、膨大なコストになる思います。
どこかの業者に丸投げしていたり、人件費の安いところでそんな事をしているのでしょうか。

回答の条件
  • URL必須
  • 1人2回まで
  • 登録:2006/10/10 01:10:48
  • 終了:2006/10/17 01:15:03

回答(3件)

id:unknownmelodies No.1

unknownmelodies回答回数227ベストアンサー獲得回数42006/10/10 01:15:17

ポイント27pt

自動でページをめくってくれる超高速スキャナで、読み取っているそうです。凄すぎる。

http://www.classicajapan.com/wn/archives/000721.html

id:tetlis

おお!謎のページめくり機+スゴイOCR技術って事ですね。

仕事柄、電子化しているという事よりも、どうやって電子化しているんだろうと言うところがずっと気になっていました。

そういうことってみんなあまり気にならないんですかね。

ありがとうございます。

2006/10/10 01:24:53
id:worris No.2

worris回答回数78ベストアンサー獲得回数102006/10/10 01:45:26

ポイント27pt

別のプロジェクトでは人件費の安い中国やインドでスキャン作業を行っているようですが、

「ミリオンブック計画(Million Book Project)」では、人件費の安い国に書籍を送りスキャンを行う。スタンフォード大学では一冊に30ドルかかるが中国では10ドルですむ。現在は1日10万ページの速度で進行中。スキャン工場はインドと中国に計20ヶ所以上あり、2年以内に100万点以上の本をデジタル化する

http://d.hatena.ne.jp/kawasaki/20060708/1152379124

Googleについては「Google誕生」(イースト・プレス)を読む限り、図書館内に機械を持ち込んで作業しているようです。

id:tetlis

この日記からたどったら他にも関連して知りたい情報が出てきました。

ありがとうございます。

2006/10/10 12:14:12
id:Rcc No.3

Rcc回答回数1ベストアンサー獲得回数02006/10/10 10:26:43

ポイント26pt

googleについてはこちらのblogがとても詳しく,わかりやすいです.

http://d.hatena.ne.jp/bookscanner/

id:tetlis

2番目の方も紹介してくださいましたが、このblog、書籍の電子化を追いかけるのにとても良いですね。

2006/10/10 12:13:40

コメントはまだありません

この質問への反応(ブックマークコメント)

「あの人に答えてほしい」「この質問はあの人が答えられそう」というときに、回答リクエストを送ってみてましょう。

これ以上回答リクエストを送信することはできません。制限について

絞り込み :
はてなココの「ともだち」を表示します。
回答リクエストを送信したユーザーはいません