ふと疑問に思ったのですが、人力検索は質問文だけが Google 検索にヒットしますよね。

回答やコメント欄の記述はヒットしません。これはどの様にして成されているのですか?

ぱっと見では <meta name="robots" content="nofollow"> などと記述されている訳でも無さそうなのですが。

具体的な引用をお願いします。

回答の条件
  • 1人2回まで
  • 登録:
  • 終了:2009/10/30 13:51:38
※ 有料アンケート・ポイント付き質問機能は2023年2月28日に終了しました。

ベストアンサー

id:syntaxerror No.1

回答回数354ベストアンサー獲得回数56

ポイント55pt

質問文の部分全部が「H1タグ」で囲まれているからだと思います。

id:Reiaru

<h1>aaa</h1>

<h2>bbb</h2>

<h3>ccc</h3>

ddd


では、こうした場合には bbb と ccc、そして ddd はヒットしなくなりますか?

そんな事は無いと思うのですが。事実、私の管理するサイトでも bbb、ccc、ddd のいずれもがヒットしています。

2009/10/29 20:15:51

その他の回答1件)

id:syntaxerror No.1

回答回数354ベストアンサー獲得回数56ここでベストアンサー

ポイント55pt

質問文の部分全部が「H1タグ」で囲まれているからだと思います。

id:Reiaru

<h1>aaa</h1>

<h2>bbb</h2>

<h3>ccc</h3>

ddd


では、こうした場合には bbb と ccc、そして ddd はヒットしなくなりますか?

そんな事は無いと思うのですが。事実、私の管理するサイトでも bbb、ccc、ddd のいずれもがヒットしています。

2009/10/29 20:15:51
id:sirotugu40 No.2

回答回数449ベストアンサー獲得回数14

ポイント55pt

googlebotだけ別のページ(質問文のみ)を見せてるから。

http://d.hatena.ne.jp/Hamachiya2/20090707/google

http://d.hatena.ne.jp/Hamachiya2/20090609/cloaking

id:Reiaru

あ、下の記事は最近どこかで見かけた記憶があります。

てっきり人力検索とは無関係かと流し読みしていました。


なるほど、クローキングですか。

そうですよね、(普通に考えると) そうでなければ無理ですよね。

(ただ、そうなりますとヒット数を増やすのではなく逆に減らす事になりますので、ある意味不可解ではありますが(笑))


現在、検証できる状態にはないので、明日辺りにでも調べてみたいと思います。

2009/10/29 20:32:34
  • id:syntaxerror
    はてなでは質問文をH1タグで囲っているだけでH2タグは意味のある他のコンテンツを囲んでいません。
    要するに「H1タグで囲まれたやけに長大な質問文」と「それ以外の文」だけで構成されています。
  • id:meefla
    回答欄であれコメント欄であれ、ヒットするのでは?

    解答欄の例:
    http://q.hatena.ne.jp/1250003928
    "Beside the Sea with Bulkhead" でググれば 1ページ目にヒットします。

    コメント欄の例:
    http://q.hatena.ne.jp/1250594567
    横浜商館天主堂ノ図 でググれば 2ページ目にヒットします。
  • id:Reiaru
    ● http://q.hatena.ne.jp/1249546629

    質問文
    http://www.google.co.jp/search?q=%22%E3%81%AF%E3%81%A6%E3%81%AA%E3%81%A7%E8%B2%A9%E5%A3%B2%E3%81%99%E3%82%8B%E3%82%AA%E3%83%AA%E3%82%B8%E3%83%8A%E3%83%AB%E3%82%B0%E3%83%83%E3%82%BA%E3%81%A7%E3%80%8C%E3%81%93%E3%82%93%E3%81%AA%E3%81%AE%E3%81%8C%E3%81%82%E3%81%A3%E3%81%9F%E3%82%89%E8%B2%B7%E3%81%86%E3%82%88%EF%BC%81%E3%80%8D%22+site%3Aq.hatena.ne.jp%2F1249546629&lr=lang_ja
    回答欄
    http://www.google.co.jp/search?q=%22%E3%81%93%E3%81%A1%E3%82%89%E3%81%AB%E3%82%82%E6%9B%B8%E3%81%84%E3%81%9F%E6%B0%97%E3%81%8C%E3%81%99%E3%82%8B%E3%81%AE%E3%81%A7%E3%81%99%E3%81%8C%E3%80%81%22+site%3Aq.hatena.ne.jp%2F1249546629&lr=lang_ja

    こちらは確かに質問文も回答もヒットしています。

    --------------------------------------------
    ● http://q.hatena.ne.jp/1256731208
    質問文
    http://www.google.co.jp/search?q=%22MacOS+X+%E3%81%8B+Windows+%E3%81%A7%22+site%3Aq.hatena.ne.jp%2F1256731208&lr=lang_ja
    回答欄
    http://www.google.co.jp/search?q=%22%E3%82%AB%E3%83%A1%E3%83%A9%E3%81%AF%E9%80%9A%E5%B8%B8%E3%81%AEWeb%E3%82%AB%E3%83%A1%E3%83%A9%E3%81%A7%E8%89%AF%E3%81%84%E3%81%A8%E6%80%9D%E3%81%84%E3%81%BE%E3%81%99%E3%80%82%22+site%3Aq.hatena.ne.jp%2F1256731208&lr=lang_ja
    コメント欄
    http://www.google.co.jp/search?q=%22%E3%83%87%E3%82%B8%E3%82%BF%E3%83%AB%E3%83%8F%E3%83%B3%E3%83%87%E3%82%A3%E3%83%BC%E3%82%AB%E3%83%A0%E3%82%92%E3%83%86%E3%83%AC%E3%83%93%E3%81%AB%E7%B9%8B%E3%81%92%E3%81%B0%E3%81%84%E3%81%84%22+site%3Aq.hatena.ne.jp%2F1256731208&lr=lang_ja

    これがよく分からないのですが、現在は回答欄の文字列はヒットしないものの、コメント欄はヒットするという状態になっています。
    しかし、先程まではコメント欄もヒットしていませんでした。

    --------------------------------------------
    そうなりますと、クローラーが走ってインデックス化する時に、syntaxerror 様がおっしゃる様に h タグを見てどうこうしている…?
    クロールってページ単位で行われるものだと思っていたのですが、実はページの「部分毎」に行われているのでしょうか?

    何だか訳が分からなくなってきました。
  • id:syntaxerror
    クローキングの効果を否定はしませんが、私はH1タグの効果が普通に考える以上に検索結果に反映されているのだと思っています。またはてながこれで質問文全体を囲ってしまう、それを参照する多くのサイトがまた参照するという連鎖が起こり質問文だけが検索上位に来るのでしょう。
    はてなで質問を見てから回答を探そうと検索するとすでに検索上位に当のはてなの質問が現れてくる現状を考えるとある意味、H1スパムと呼んでもいいとすら思います。
  • id:syntaxerror
    それから、はてぶアイコンのAlt属性に質問文の大部分が含まれているのも相当効果を上げていると思います。
  • id:Reiaru
    ああ、ブックマークのアイコン…そうですよね。
    これたまに私の環境だとバグって alt の文字そのものが表示されるので気になるのです。
    ある意味質問が二重に書かれている様なものですから、ちょっといんちきくさいですよね。

    > はてなで質問を見てから回答を探そうと検索するとすでに検索上位に当のはてなの質問が現れてくる現状

    ありますよね、すごい速度です(笑)
  • id:ken3memo
    rssの
    <item>
    <title></title>
    <link></link>
    <description></description>
    </item>
    の<description>も見ているとか、、、で、質問文が数多く関連付けされているのでは?
    とまたまた、想像・妄想を書いてみました。
    でも、質問文が重要視されるのはイイとして、回答欄やコメントがレイアウト上、下にあっても検索されると思うけど、う~ん、なんか疑問ですよね。
    と、ふりだしに戻してみた(ぉぃぉぃ)

  • id:Reiaru
    まず、この質問の前提が間違っている様 (質問文しか拾われないというのは偽) ですので、
    別質問にしないといけない気がしています。

    何故ページ自体はクロールされているのに、同一ページで検索される箇所とそうでない箇所があるのか。
    つまり、h1 h2 h3 などで Google にインデックス化されるまでの速度が変わってくるのではないのか。
    (速度は違っても、最終的にはページ全文から検索が可能になる)

    これが真だとすれば、何か今まで私が思っていたのとは Google クローラーの動き方が違うと言いますか。
    何にしても結構「なんですと!?」状態になってきています。

    クローキングについては調べるのが少々面倒 (酔っぱらっているので) なので厳密には調べていないのですが、
    単純にログアウトして Agent を書き換えてアクセスしても同じページが表示される事は確認しました。
    (多分、人力検索ではそれは無いと思うのです。ヒット数を増やすならともかく、減らす意味がありませんから)
  • id:Reiaru
    ですが、例えそれが違っていたとしても sirotugu40 様の回答も私にとっては非常に有益なものです。

    私はアフィリエイトなどは行っていないのですが、
    そういう手法で特定箇所のみを検索エンジンの検索対象から外す手段があるという事を認識する事をできましたので。
  • id:b-wind
    この分野はそこまで詳しくはないが以下の情報は規定事項と考えていいはず。
    > クロールってページ単位で行われるものだと思っていたのですが、実はページの「部分毎」に行われているのでしょうか?
    クロール自体はページ単位。ただ、その結果のキーワード毎のランク付けには title, h1 等のタグを優先するなど
    部分によって重み付けがされている。
    ただ、重み付けの度合いはたびたび変わってるしランキング方法も何度も変わって順位が乱高下することも過去何度もあった。
    「今現在」どういう評価をされるかははっきりとはわからんねぇ。

    > ある意味質問が二重に書かれている様なものですから、ちょっといんちきくさいですよね。
    一応 HTML のアクセシビリティという点では正しい方向なのだよね。
    レンダリング終了まではちょっとウザイけど。
    http://w3j.org/articles/practicalaccessiblehtml/practicalaccessiblehtml01.html
    まぁ、冗長ではあるけどこの程度は Google の過去のスパム対策によってほぼ影響は無いはず。
  • id:Reiaru
    b-wind 様、コメントありがとうございます。
    確かにこれは正しいのですよね。悪質なのになると画像なんかとは全く関係ない alt が書いてあったりしてますし(笑)

    取りあえずパケットを調べてみたのですが、人力検索の質問一覧や質問ページそのものではクローキングは確認できませんでした。
    (全てが HTTP/1.1 304 Not Modified です)

    そうなりますと、やはり h タグなのですね。
    いずれは検索対象になるとはいえ、それが検索対象になるまでの早さには結構差が付いたりする事もあると。

    ちょっと話が逸れてしまいましたが、色々と為になりました。皆様もありがとうございました。
  • id:syntaxerror
    はてなのHタグの使い方は以下のようになっています。


    <h1>
    質問文をつらつら


    </h1>
    <h2>この質問・回答へのコメント</h2>
    <h3>回答者:(ユーザー名[alt=""]) (日付&時間) 満足!(ポイント数)</h3>

    以下、回答文諸々


    H1は質問内容そのものを囲んでいるのに対してH2,H3は具体的な回答内容を含んでいない、かつどの質問でも似たり寄ったりの大した意味の無い内容だけを囲っています。
    これをクローラーが見た場合、h1にはやたら情報が豊富に入っているのにh2,h3は大した情報は無い、ましてやそれに続く文は取るに足らないだろうと評価されることは想像に難くないですね。

    h1で質問文まるまま囲うならそれぞれの回答文もh1で囲わないと論理構造としてはおかしな話です。
    少なくともベストアンサーになった回答をh1で囲むくらいしないと検索結果に回答の記述がヒットすることは期待できないでしょうね。要するにはてなのサイトの作りとして回答文やコメントの扱いをわざと極端に低くしているのが原因としか思えません。
  • id:doumoto
    この質問を見てから、hタグの効果を考えてるんだけど、hタグの本来的な使い方であれば、
    <h1>質問
    <h2>回答1
    <h3>回答1へのコメント
    <h2>回答2
    <h3>回答2へのコメント
    ってな構成が正しいような。
    http://www.tagindex.com/html_tag/text_font/h.html
    ところが、なんとなくの感覚だと、<h1>タグ以外のSEO効果ってあるのかな?って感じで、結局、<h1>タグだけってな、構成になってるような。(´ー`)y-~~。
    http://www.suzukikenichi.com/blog/how-important-are-header-tags-for-seo/
    はてな村のコンテンツが検索エンジンの上位に表示されるって事は、SEO的に効果が出てる正しい?形なのかなあと。
  • id:Reiaru
    かねてから、syntaxerror 様につきましては有能な回答者であるという認識をしております。
    そうですね、最初からその様に書いて下されば良かったのに~とかとか。
    それはさておきまして、回答といるかだけを見ると「何でこれでいるかになっちゃったの?」とか思われそうですが、
    そこは回答に対するコメントに追記しなかった私の落ち度ですね、申し訳ありませんでした。

    doumoto 様のおっしゃる「h1」しか見ていないのではという件については、確かに今はそうなのかもしれません。
    確かに h2 とか h3 とかを本当に順位付けて見ているのだろうかとかその辺りの疑問はあります。
    ただ、それは b-wind 様も述べておられる様に「いつ変わるかも分からない」のですよね。

    ですので、SEO 業者も経験に基づく推測であれこれ行っている訳ですけれど、そこまで SEO って重要なのでしょうかね~?
    結局の所はいたちごっこと言いますか、内容の無いサイトが真に有益なサイトを下方に押しやるだけの物のようなとか。
    で、その内容のあるサイトは SEO SEO 言わなくても常にある程度の位置にランクされているという事実もあります。
    (彼らとてそれなりには SEO 云々ではなく、正しい HTML 構文を書く事程度は気をつけている筈ですが)

    SEO SEO 言うサイトに限って中身がまるで無いサイトなのは何故なのでしょう? (苦笑)

この質問への反応(ブックマークコメント)

「あの人に答えてほしい」「この質問はあの人が答えられそう」というときに、回答リクエストを送ってみてましょう。

これ以上回答リクエストを送信することはできません。制限について

回答リクエストを送信したユーザーはいません