Google・Yahoo!・MSNなどで使われている検索エンジンのアルゴリズムについて教えていただきたいです。
基本的な動作(クロールなど)はわかるのですが、日本語特有の単語認識やリンクの探し方・データベースの項目などを詳しく解説していただけるとありがたいです。
http://pcweb.mycom.co.jp/column/yetanother/045/
【コラム】Yet Another 仕事のツール 第45回 日本語形態素解析ツール「ChaSen」 (MYCOMジャーナル)
単語認識についてのみですが、日本語特有の処理として日本語形態素解析があります。このサイトの解説は役に立つと思います。
回答ありがとうございます。
しかし、情報が削除されていて、みれませんでした。
http://hatena.g.hatena.ne.jp/hatenamagazine/20060309/1141897640
機能変更、お知らせなど - はてなメールマガジン『週刊はてな』 - はてなダイアリーおもしろ情報チェック術&3/13人力検索はてなメンテナンスのお知らせ
●ご登録質問の早期終了のお願い
今回のメンテナンスでは登録中の質問状態の保持が不可能なため、現在、はて
なに質問をご登録中で、質問の終了期限が3/13以降の質問者様には、通常スケ
ジュールよりも早い終了操作をお願いします。
質問を回答受付状態もしくは締切状態にされますと、メンテナンス時にはてな
にて自動終了処理がおこなわれ、1件も回答が寄せられていない場合は自動
キャンセル、回答がある場合は未閲覧の回答を一件開いた上で、各回答者にポ
イント均等支払いならびにはてなに手数料が支払われる処理がおこなわれま
す。あらかじめご了承いただきますようお願い申し上げます。
この度は、お手数をおかけし誠に申し訳ございませんが、ご協力いただきます
ようお願いいたします。
人力検索はてな
はてなのメンテナンスで、質問を終了せざるを得ないためにキャンセルさせていただきます。
なお、回答をしていただいた「T_Fuchi」さんには、ポイントを送信させていただきます。
以下はてなのコメントより引用
今回のメンテナンスでは登録中の質問状態の保持が不可能なため、現在、はてなに質問をご登録中で、質問の終了期限が3/13以降の質問者様には、通常スケジュールよりも早い終了操作をお願いします。
回答ありがとうございました。
日本語認識システム?についての情報がなかなかでてこなかったのでありがたいです。