人力検索はてな
モバイル版を表示しています。PC版はこちら
i-mobile

googleで思うようにインデックスされていないのが気になります。
特に気になるのが、

site:www.ほげ.com

でインデックス数を調べるとき

「ウェブ全体から検索」
「日本語のページを検索」

とでは、ヒット数が後者が圧倒的に少ない(半分以下)です。
なぜなんでしょうか。
全ページには日本語が含まれていますし、文字コードもEUC-JPで統一しています。Google Sitemapsを試したら、その直後は前者の結果だけは数字が伸びたのですが、しばらくしてまた元にもどりました。
また、前者には含まれて、後者には含まれないページを調べることはできますでしょうか。

●質問者: kyoko55
●カテゴリ:インターネット ウェブ制作
✍キーワード:EUC-JP Google Google Sitemaps WWW ほげ
○ 状態 :終了
└ 回答数 : 2/2件

▽最新の回答へ

1 ● b-wind
●65ポイント ベストアンサー

ページに文字コード宣言はしていますか?

http://www.mozilla.gr.jp/standards/webtips0022.html


「日本語のページ」として認識される為にはきちんと宣言してあげるのが先決かと思います。

また、サーバー側の HTTP ヘッダーで別の Content-Type が設定されている場合はそちらで判断しているかもしれません。

Live HTTP headers 等のツールで確認してみると良いかもしれません。

http://firefox.geckodev.org/index.php?Live%20HTTP%20headers

◎質問者からの返答

ありがとうございます。

HTMLのMETAタグでは常にEUC-JPで宣言しています。

が、HTTPヘッダーでは特別指定していませんでした。Webツールで調べると後者はサーバが勝手につけた(?)単なる「Content-Type: text/html;」となってました。

google「ウェブマスターツール」にログインして調べると、「統計」「ページ分析」の「エンコード」は「EUC-JP (日本語 EUC)」が40%ぐらいなのに対して「US-ASCII」は50%となってます。

「日本語のページを検索」での検索結果が少ないのはGoogleが当サイトの過半数を「US-ASCII」で認識しているから、という認識で間違いないんですね。

そこで、HTTPヘッダーでも宣言するようにしてみました。


2 ● hamster009
●5ポイント

1に同じ

◎質問者からの返答

> 1に同じ

なんですね。

関連質問


●質問をもっと探す●



0.人力検索はてなトップ
8.このページを友達に紹介
9.このページの先頭へ
対応機種一覧
お問い合わせ
ヘルプ/お知らせ
ログイン
無料ユーザー登録
はてなトップ