googleの検索結果一覧に表示される、ページの要約文の抽出アルゴリズムを教えてください。

↓の画像の赤線で囲ってある部分です。
http://f.hatena.ne.jp/images/fotolife/h/honestaholic/20070319/20070319162356.jpg
dmozに登録されているサイトについてはdmozの紹介文がそのまま適用されているようです。
それ以外については、検索語を含むパラグラフの先端から表示しているようですが・・・たとえば「google」と検索して出てくる、wikipediaのgoogleについてのページで表示される要約文が、なぜその部分が抽出されるのかが難しいです。
ちなみに、gooの要約文もgoogleとほぼまったく同じ文章が表示されているので、同じアルゴリズムを使っているような気がします。MSNは相変わらず適当で、検索語に関係なく、タグを除いたページの頭から表示しているようです。
詳しい方、宜しくお願いします。

回答の条件
  • 1人1回まで
  • 登録:2007/03/19 16:39:29
  • 終了:2007/03/26 16:40:03

回答(2件)

id:cubick No.1

cubick回答回数125ベストアンサー獲得回数362007/03/19 18:32:56

ポイント35pt

html中にMETAタグでDescriptionを指定してやると、検索ロボットが拾ってくれるようになっています。

http://www.tagindex.com/html_tag/page/meta_02.html

id:honestaholic

googleは本文からも要約文を生成します。

2007/03/21 02:25:58
id:aufan No.2

aufan回答回数4ベストアンサー獲得回数02007/03/19 22:14:48

ポイント35pt

ホームページを作成する最のHTMLの一番最初の<html>の後に、

<meta content="あいうえお">

と記入することで

あいうえお が赤枠の中に表示する様に指示できますよ。

id:honestaholic

googleは本文からも(ry

2007/03/21 02:28:20

コメントはまだありません

この質問への反応(ブックマークコメント)

トラックバック

「あの人に答えてほしい」「この質問はあの人が答えられそう」というときに、回答リクエストを送ってみてましょう。

これ以上回答リクエストを送信することはできません。制限について

絞り込み :
はてなココの「ともだち」を表示します。
回答リクエストを送信したユーザーはいません