Googleの検索エンジンについて質問です。

(IT関係者じゃないので分かりやすい説明でお願いします。)

例えば、XXXXという単語を検索した際に結果が0件だったとします。
それなのに、XXXX site:A で検索すると、ヒットし、
サイトAには、XXXXについて書かれている場合があります。
(サイトAは、グーグルにクロールはされ、キャッシュも残っています。)

今まで、Googleというのは、クロールした全てのキャッシュの中から検索していると思っていたのですが、そうではないのでしょうか?
キャッシュされていても、引っかかってこない(0件と表示されるが実は0件ではない)情報というのも結構あるのでしょうか?

検索の仕組みなども交えて、簡単に説明して頂けると幸いです。

回答の条件
  • 1人5回まで
  • 登録:2008/01/29 20:49:53
  • 終了:2008/02/05 04:49:33

ベストアンサー

id:koujirou6218 No.1

koujirou回答回数597ベストアンサー獲得回数472008/01/29 22:19:12

ポイント35pt

site演算子は、Googleが認識しているURLを表示するコマンドです。

さらに、キーワード site:URL とするとそのURL内の指定されたキーワードをサイト内で検索します。

なのでXXXXというキーワードはこのサイト(URL)と認識するのは別の話になってきます。

YYYというキーワードだとヒットするかもしれません。

Googleが、XXXというキーワードとそのサイトの関連付けができていないためです。(わかりやすく説明しているため多少語弊がありますが…)

実は、GoogleとYahooのキャッシュの相違があるのでGoogleに絞って書き込みますが、Yahoo、Googleに関わらず毎日何万件と検索されるのでたくさんのサーバを用意しています。

しかしそれらのサーバは全て同じデータを持っているとは限りません。

たくさんあるためサイトインデックスを更新するのに時間がかかるのです。

Googleでは、指定のキーワードがヒットしたサイトがもしダウンしていた場合でも閲覧できるようにするためにキャッシュを保存しています。そのため、キャッシュは古い情報になりがちになるためGoogleは間違ってもキャッシュから検索しようとはしません。

また、目的がバックアップのためキャッシュがあっても検索にヒットしないことはよくあります。原因は様々ですが、サイトとキーワードが関連付けられていない場合が殆どでこれはサイト作成者の正しくないHTML文法のために起こります。逆にあるキーワードで自分のサイトを表示させることもできます。(SEO対策といわれるものです)

Googleは、独自のアルゴリズムでキーワードに最適なサイトを計算し検索結果として出力しています。

id:match7

ううむ、部外者にはイマイチよく分からない点もあるのですが、

今までは、てっきり、XXXX site:全て という検索が、

デフォルトの検索に相当すると思っていたので、

サイト指定をしようがしまいが同じ結果は必ず出力されると思っていたので、

結構驚いてます。

2008/01/30 00:24:46

その他の回答(1件)

id:koujirou6218 No.1

koujirou回答回数597ベストアンサー獲得回数472008/01/29 22:19:12ここでベストアンサー

ポイント35pt

site演算子は、Googleが認識しているURLを表示するコマンドです。

さらに、キーワード site:URL とするとそのURL内の指定されたキーワードをサイト内で検索します。

なのでXXXXというキーワードはこのサイト(URL)と認識するのは別の話になってきます。

YYYというキーワードだとヒットするかもしれません。

Googleが、XXXというキーワードとそのサイトの関連付けができていないためです。(わかりやすく説明しているため多少語弊がありますが…)

実は、GoogleとYahooのキャッシュの相違があるのでGoogleに絞って書き込みますが、Yahoo、Googleに関わらず毎日何万件と検索されるのでたくさんのサーバを用意しています。

しかしそれらのサーバは全て同じデータを持っているとは限りません。

たくさんあるためサイトインデックスを更新するのに時間がかかるのです。

Googleでは、指定のキーワードがヒットしたサイトがもしダウンしていた場合でも閲覧できるようにするためにキャッシュを保存しています。そのため、キャッシュは古い情報になりがちになるためGoogleは間違ってもキャッシュから検索しようとはしません。

また、目的がバックアップのためキャッシュがあっても検索にヒットしないことはよくあります。原因は様々ですが、サイトとキーワードが関連付けられていない場合が殆どでこれはサイト作成者の正しくないHTML文法のために起こります。逆にあるキーワードで自分のサイトを表示させることもできます。(SEO対策といわれるものです)

Googleは、独自のアルゴリズムでキーワードに最適なサイトを計算し検索結果として出力しています。

id:match7

ううむ、部外者にはイマイチよく分からない点もあるのですが、

今までは、てっきり、XXXX site:全て という検索が、

デフォルトの検索に相当すると思っていたので、

サイト指定をしようがしまいが同じ結果は必ず出力されると思っていたので、

結構驚いてます。

2008/01/30 00:24:46
id:hrkt0115311 No.2

どんジレ、どんさん回答回数892ベストアンサー獲得回数512008/01/29 22:48:00

ポイント35pt

こんばんは。


Google では、検索結果は最大1000件と決まっている。Google による評価が1000位以下になってしまった場合、Google に登録されてても検索結果には出てこない、それだけの事である。おそらく、大半の人はランクが落ちただけであわてているのではないかと思う。

http://www001.upp.so-net.ne.jp/wakan/Others/GoogleDeleted.html 左記より参照

上記サイトの解説が分かりやすいと思います。よろしければご参照下さい。


最大1000件、という点について、試してみました。「Search」の検索結果です。


97.5億該当して、その中から1~1000件までを表示しているのが確認できるかと思います。


>今まで、Googleというのは、クロールした全てのキャッシュの中から検索していると思っていたのですが、そうではないのでしょうか?

インデックスから検索結果を表示する点はご理解の通りだと思います。ただ1001件目以降の情報は表示されなくなってしまうのですね。


>キャッシュされていても、引っかかってこない(0件と表示されるが実は0件ではない)情報というのも結構あるのでしょうか?

キーワード検索で0と表示され、「site:A ××××」と検索した時だけ表示されるケースについては、私は確認したことがないです。(私が知らないだけだったらすみません)


以上、参考になれば幸いです。

id:match7

うーん、前にそういうことがあったんだけど、

ブックマークしていなかったから分からなくなってしまった。

でも、確かにありました。何だかすっきりしないなあ。

2008/01/30 00:46:04

コメントはまだありません

この質問への反応(ブックマークコメント)

「あの人に答えてほしい」「この質問はあの人が答えられそう」というときに、回答リクエストを送ってみてましょう。

これ以上回答リクエストを送信することはできません。制限について

絞り込み :
はてなココの「ともだち」を表示します。
回答リクエストを送信したユーザーはいません