『1万年と2千年前から愛してる』で検索すると
ウィキペディアの『創聖のアクエリオン - Wikipedia』が2番目に表示されるのですが、
どんな感じでこれが上位になってるんでしょう。
ちまちま人がやっているとは思えないのですが、検索エンジンが学習するってことなんでしょうか?
Co-Occurrence(共起と訳すみたいですね)という概念があります。
これは同じページ内でよく一緒に使われるキーワードをセットで考えるというものです。
これを使えば、「1万年と2千年前から愛してる」とよく一緒に使われているキーワードが多いページを「関連性が高いページ」と判定することが出来ます。
しかしこのケースの場合はページ内に関連キーワードを多く含んでいますので、共起なしでも検索上位に上がる可能性は高いだろうと思われます。
例えば以下のワンフレーズには "一万" "二千" "愛"というキーワードが含まれます。
OVA2巻限定愛蔵版に付属するCDドラマ「一万二千年の足跡」
こんな感じでページ内にキーワードが何度も出てきています。
キーワード | 出現数 |
---|---|
一万二千 | 14回 |
12000年 | 9回 |
一万と二千 | 1回 |
二千年 | 14回 |
前 | 48回 |
愛 | 31回 |
愛し | 3回 |
ポイントは以下のとおりです
これにより、創聖のアクエリオンのwikipediaページは『1万年と2千年前から愛してる』というフレーズの要素を網羅するものに仕上がっています。
これは検索エンジンの上位に来るのに十分な条件を満たしていると思われます。
もう一つおまけに、googleで二重引用符付きの検索をすると、フレーズと完全一致するページだけが検索できます。
試しに"一万年と二千年前から愛してる"で検索してみると 「創聖のアクエリオン - Wikipedia」がHITします。
ページ内に『一万年と二千年前から愛してる』というフレーズが無いのにも関わらず、です。
なぜこんなことが起こるかというと、wikipediaには 実は「一万年と二千年前から愛してる」というページがありまして、このページにアクセスすると「創聖のアクエリオン」のページに自動転送される設定になっているからです。
これはリダイレクトという仕組みを使っていて、転送前のページの検索エンジン上の評価を受け継ぐことが出来ます。
要するに、「創聖のアクエリオン」のページは、wikipedia側から「一万年と二千年前から愛してる」と関連付けがされているのです。
その結果「一万年と二千年前から愛してる」での検索順位が向上したと考えられます。
この件についてはgoogleが検索エンジンが自動で学習したというよりも、wikipedia側から検索エンジンに手動で学習させた、可能性が高いと思われます。
私も、二番目に表示されました。
Googleの検索結果は、ページランクアルゴリズムという仕組みで表示されています。以下のような感じです。
ページランク・アルゴリズムでは、重要とされるページからリンクされている数を評価の基本とする。リンク元ページの重要度もページランクで決定されるため、そのアルゴリズムは再帰的になる。Googleはページランクだけでなく様々な指標を検索結果の順位付けに追加しており、今では200以上の異なる指標を使っているという。不当な順位の操作を防ぐためと、競合他社への優位を確保するため、詳細は秘密にされている。
Google検索 - Wikipedia
おっしゃっていることは良くわかります。
同時に検索されたり、互いの検索結果ページに含まれているので(しかもタイトルとか
重要な箇所に)「「1万年と~」と「創聖~」が徐々に繋がっていったんですかね。
あまりにも鮮やかだったので、人間の手が介されているのでは……といぶかしんだところで質問したのです。
良い意見ありがとうございました。
Co-Occurrence(共起と訳すみたいですね)という概念があります。
これは同じページ内でよく一緒に使われるキーワードをセットで考えるというものです。
これを使えば、「1万年と2千年前から愛してる」とよく一緒に使われているキーワードが多いページを「関連性が高いページ」と判定することが出来ます。
しかしこのケースの場合はページ内に関連キーワードを多く含んでいますので、共起なしでも検索上位に上がる可能性は高いだろうと思われます。
例えば以下のワンフレーズには "一万" "二千" "愛"というキーワードが含まれます。
OVA2巻限定愛蔵版に付属するCDドラマ「一万二千年の足跡」
こんな感じでページ内にキーワードが何度も出てきています。
キーワード | 出現数 |
---|---|
一万二千 | 14回 |
12000年 | 9回 |
一万と二千 | 1回 |
二千年 | 14回 |
前 | 48回 |
愛 | 31回 |
愛し | 3回 |
ポイントは以下のとおりです
これにより、創聖のアクエリオンのwikipediaページは『1万年と2千年前から愛してる』というフレーズの要素を網羅するものに仕上がっています。
これは検索エンジンの上位に来るのに十分な条件を満たしていると思われます。
もう一つおまけに、googleで二重引用符付きの検索をすると、フレーズと完全一致するページだけが検索できます。
試しに"一万年と二千年前から愛してる"で検索してみると 「創聖のアクエリオン - Wikipedia」がHITします。
ページ内に『一万年と二千年前から愛してる』というフレーズが無いのにも関わらず、です。
なぜこんなことが起こるかというと、wikipediaには 実は「一万年と二千年前から愛してる」というページがありまして、このページにアクセスすると「創聖のアクエリオン」のページに自動転送される設定になっているからです。
これはリダイレクトという仕組みを使っていて、転送前のページの検索エンジン上の評価を受け継ぐことが出来ます。
要するに、「創聖のアクエリオン」のページは、wikipedia側から「一万年と二千年前から愛してる」と関連付けがされているのです。
その結果「一万年と二千年前から愛してる」での検索順位が向上したと考えられます。
この件についてはgoogleが検索エンジンが自動で学習したというよりも、wikipedia側から検索エンジンに手動で学習させた、可能性が高いと思われます。
おおぃぃっ。
もうちょっと、もやもやっとしたまま終わるのかと思ったら、
転送ページがあったとは。
『一万年と~』は、もはやフレーズとして定着しきったのですね。
リダイレクトがかかっているのなら何となく、問答無用で検索上位にくるのも
肯けます。
いや、程よい回答をありがとうございました。
http://www.sem-r.com/sem/google/20030819131209.html
http://detail.chiebukuro.yahoo.co.jp/qa/question_detail/q141079269
http://ja.wikipedia.org/wiki/Google_Web_Accelerator#Google_Web_Accelerator
wikipediaにかいてあるようにページランクも使っていますが
他のものも使っているんじゃないだろうかという意見も
あるようです
つまり
いろいろ他のものとあわせて出しているんじゃないでしょうか
ホームページの制作会社を経営しております。
得意な分野は、SEOやSNSです。
Googleは、ユーザーの利便性を第一に有効な検索結果を表示する事を目指しています。
つまり、人工知能を目指していると言う事です。
詳細なロジックは公開されていませんが、概要は、ヘルプに記載されています。
また、検索エンジンの最高責任者のマットカツ氏のブログやストリームも閲覧することが出来ます。
そこでは、200以上のシグナルを判定し、検索結果に反映させていると言っています。
また、時にはスパム行為にあたるサイトに関しては、手動でもペナルティーを科すとしています。
ヘルプの日本語訳は、変なので、全て英文で読むことをお勧めします。
おおぃぃっ。
2012/02/02 20:41:58もうちょっと、もやもやっとしたまま終わるのかと思ったら、
転送ページがあったとは。
『一万年と~』は、もはやフレーズとして定着しきったのですね。
リダイレクトがかかっているのなら何となく、問答無用で検索上位にくるのも
肯けます。
いや、程よい回答をありがとうございました。