honestaholic回答ポイント 70ptウォッチ 5

googleの検索結果一覧に表示される、ページの要約文の抽出アルゴリズムを教えてください。

↓の画像の赤線で囲ってある部分です。
http://f.hatena.ne.jp/images/fotolife/h/honestaholic/20070319/20070319162356.jpg
dmozに登録されているサイトについてはdmozの紹介文がそのまま適用されているようです。
それ以外については、検索語を含むパラグラフの先端から表示しているようですが・・・たとえば「google」と検索して出てくる、wikipediaのgoogleについてのページで表示される要約文が、なぜその部分が抽出されるのかが難しいです。
ちなみに、gooの要約文もgoogleとほぼまったく同じ文章が表示されているので、同じアルゴリズムを使っているような気がします。MSNは相変わらず適当で、検索語に関係なく、タグを除いたページの頭から表示しているようです。
詳しい方、宜しくお願いします。

※ 有料アンケート・ポイント付き質問機能は2023年2月28日に終了しました。
ログインして回答する

みんなの回答

この質問へのコメント

コメントはありません

この質問への反応(ブックマークコメント)

質問の情報

登録日時
2007-03-19 16:39:29
終了日時
2007-03-26 16:40:03
回答条件
1人1回まで

この質問のカテゴリ

この質問に含まれるキーワード

Wikipedia596Google3482アルゴリズム292goo322MSN262赤線18パラグラフ12適用908

人気の質問

メニュー

PC版