人力検索はてな
モバイル版を表示しています。PC版はこちら
i-mobile

robots.txtに関する質問です。

index.html(ルートディレクトリ)
.....|__aaa
..............|__bbb
..............|__ccc

上記のディレクトリ構成の場合、検索エンジンのロボットに対しcccフォルダのみを登録しないよう命令するには下記の記述で正しいのでしょうか?

User-agent: *
Disallow: /aaa/ccc/

ご回答をお待ちしております。

●質問者: japanski
●カテゴリ:ウェブ制作
✍キーワード:AAA CCC HTML INDEX Robots.txt
○ 状態 :終了
└ 回答数 : 2/2件

▽最新の回答へ

1 ● b-wind
●28ポイント

特に問題ないと思う。

robots.txt とは?

◎質問者からの返答

すみません、質問に対する説明がなされているURLを付けてもらうと助かります。


2 ● kn1967
●42ポイント ベストアンサー

Google の検索結果にコンテンツが表示されないようにする方法

Preventing content from appearing in Google search results

(英語になった場合は右上のプルダウンメニューで”日本語”に切り替えてください)


上記のようにgoogleなどの説明ページでもお望みのパターンそのものを説明したものはありません。

個人のページなどであれば説明したものもありますが

その信頼度は、ここで回答しているメンバーの言葉よりも落ちる可能性のほうが高いです。


ちなみに下記がgoogleに書かれているrobots.txtです。

ご質問と同じような形でサブディレクトリに対してブロックしている記述もありますので

参考になるかと思います。

http://www.google.com/robots.txt


最後になりましたが、その書き方でOKです。

b-wind氏が「特に問題ないと思う」というあいまいな書き方をしておられるのは

「いつどこで誰が見つけてリンクを張らないとも限らないから」です。

公開サーバ上に置いてある限り絶対は無いという事は理解しておられますよね?

◎質問者からの返答

>個人のページなどであれば説明したものもありますが

>その信頼度は、ここで回答しているメンバーの言葉よりも落ちる可能性のほうが高いです。

なるほど・・・

googleのrobots.txtは非常に参考になります。

メタタグと共用して対応することにします。

どうもありがとうございました。

関連質問


●質問をもっと探す●



0.人力検索はてなトップ
8.このページを友達に紹介
9.このページの先頭へ
対応機種一覧
お問い合わせ
ヘルプ/お知らせ
ログイン
無料ユーザー登録
はてなトップ