もし人手を使ってストレートにテキスト化しているとしたら一冊~万円かかるでしょうから、膨大なコストになる思います。
どこかの業者に丸投げしていたり、人件費の安いところでそんな事をしているのでしょうか。
別のプロジェクトでは人件費の安い中国やインドでスキャン作業を行っているようですが、
「ミリオンブック計画(Million Book Project)」では、人件費の安い国に書籍を送りスキャンを行う。スタンフォード大学では一冊に30ドルかかるが中国では10ドルですむ。現在は1日10万ページの速度で進行中。スキャン工場はインドと中国に計20ヶ所以上あり、2年以内に100万点以上の本をデジタル化する
Googleについては「Google誕生」(イースト・プレス)を読む限り、図書館内に機械を持ち込んで作業しているようです。
この日記からたどったら他にも関連して知りたい情報が出てきました。
ありがとうございます。
2番目の方も紹介してくださいましたが、このblog、書籍の電子化を追いかけるのにとても良いですね。
おお!謎のページめくり機+スゴイOCR技術って事ですね。
仕事柄、電子化しているという事よりも、どうやって電子化しているんだろうと言うところがずっと気になっていました。
そういうことってみんなあまり気にならないんですかね。
ありがとうございます。