index.html(ルートディレクトリ)
.....|__aaa
..............|__bbb
..............|__ccc
上記のディレクトリ構成の場合、検索エンジンのロボットに対しcccフォルダのみを登録しないよう命令するには下記の記述で正しいのでしょうか?
User-agent: *
Disallow: /aaa/ccc/
ご回答をお待ちしております。
Google の検索結果にコンテンツが表示されないようにする方法
Preventing content from appearing in Google search results
(英語になった場合は右上のプルダウンメニューで”日本語”に切り替えてください)
上記のようにgoogleなどの説明ページでもお望みのパターンそのものを説明したものはありません。
個人のページなどであれば説明したものもありますが
その信頼度は、ここで回答しているメンバーの言葉よりも落ちる可能性のほうが高いです。
ちなみに下記がgoogleに書かれているrobots.txtです。
ご質問と同じような形でサブディレクトリに対してブロックしている記述もありますので
参考になるかと思います。
http://www.google.com/robots.txt
最後になりましたが、その書き方でOKです。
b-wind氏が「特に問題ないと思う」というあいまいな書き方をしておられるのは
「いつどこで誰が見つけてリンクを張らないとも限らないから」です。
公開サーバ上に置いてある限り絶対は無いという事は理解しておられますよね?
Google の検索結果にコンテンツが表示されないようにする方法
Preventing content from appearing in Google search results
(英語になった場合は右上のプルダウンメニューで”日本語”に切り替えてください)
上記のようにgoogleなどの説明ページでもお望みのパターンそのものを説明したものはありません。
個人のページなどであれば説明したものもありますが
その信頼度は、ここで回答しているメンバーの言葉よりも落ちる可能性のほうが高いです。
ちなみに下記がgoogleに書かれているrobots.txtです。
ご質問と同じような形でサブディレクトリに対してブロックしている記述もありますので
参考になるかと思います。
http://www.google.com/robots.txt
最後になりましたが、その書き方でOKです。
b-wind氏が「特に問題ないと思う」というあいまいな書き方をしておられるのは
「いつどこで誰が見つけてリンクを張らないとも限らないから」です。
公開サーバ上に置いてある限り絶対は無いという事は理解しておられますよね?
>個人のページなどであれば説明したものもありますが
>その信頼度は、ここで回答しているメンバーの言葉よりも落ちる可能性のほうが高いです。
なるほど・・・
googleのrobots.txtは非常に参考になります。
メタタグと共用して対応することにします。
どうもありがとうございました。
>個人のページなどであれば説明したものもありますが
>その信頼度は、ここで回答しているメンバーの言葉よりも落ちる可能性のほうが高いです。
なるほど・・・
googleのrobots.txtは非常に参考になります。
メタタグと共用して対応することにします。
どうもありがとうございました。