検索エンジンからクロールされないwebサイトの公開の仕方はありますか?

URLを教えた人がアクセスする分には構わないのですが、Googleなどにクロールされて第三者からアクセスされることは避けたいと考えています。

http://hoge.sample.com/
というふうにsample.comのドメインを所有していて、hogeというサブドメインを設定してそのURLで公開したいと考えています。

サーバーはさくらレンタルサーバーのスタンダードプランです。
ドメインはムームードメインで取得しました。
ターミナルからSSHでログインしてコマンドを入力することにはそこまで抵抗はありません。

BASIC認証のような認証画面を挟むことはできるだけ避けたいです。
.htaccessかApacheかわかりませんが、なにか効果的なやり方があれば教えて頂けないでしょうか。

※URLを教えた人がツイッターにURLをつぶやくなどして、私が意図していない第三者がアクセスしうる可能性があるということは承知しています。

回答の条件
  • 1人5回まで
  • 登録:
  • 終了:2013/09/24 15:14:21
※ 有料アンケート・ポイント付き質問機能は2023年2月28日に終了しました。

ベストアンサー

id:windofjuly No.2

回答回数2625ベストアンサー獲得回数1149

ポイント60pt

どこまでやるかはあなた次第ですが、
簡単なものから、やっぱり認証を利用するところまでざっくりと…。

(1)拒否を表明する

robots.txtやHTMLタグのnoindexやnofollowを使って拒否を表明する方法は、
お約束を守ってくれる大手サイト以外に効き目はありませんが、
短期間で広まってしまうことは避けられるでしょう

(2)海外からのアクセスは拒否する

htaccessにて拒否することで無意味なアクセスは防げます。
JPに割り当てられているIPアドレス範囲
http://ftp.apnic.net/stats/apnic/delegated-apnic-latest
サンプルコードを載せておられるブログ
http://wataame.sumomo.ne.jp/archives/550

上記のdelegated-apnic-latestを利用した方法では、
バイドゥなどがクロールしてくるので、
JPNIC管理下のIPアドレス範囲で許可して、
他は必要に応じて追加するほうが賢いとは思う。
https://www.nic.ad.jp/ja/dns/jp-addr-block.html

もっと確実にしたいなら(非常に面倒ではありますが)、
あなたがURLを教えた相手の利用しているプロバイダのIPアドレス範囲を調べて許可する。

(3)BASIC認証を利用する

安易には入れなくなります。
利用者が知らぬところでプロクシを通っている場合があり、
プレーンテキストでのBASIC認証に完全性を求めることはできません。

(4)認証+SSLを利用する

今のところ、一番秘匿できる方式
さくらスタンダードでは設定を変えるだけで共有SSLを利用できるので、
これを使わない手はないのかもしれません。

id:letitflow

回答ありがとうございます。
複数の対応方法をご教示いただき、助かります。

2013/09/24 15:13:09

その他の回答2件)

id:a-kuma3 No.1

回答回数4973ベストアンサー獲得回数2154

ポイント40pt

robots.txt を設定してクローラをブロックするのが一般的だと思います。

robots.txt ファイルを使用してページをブロックまたは削除する
  ...

robots.txt ファイルを作成する

非常に単純な形式の robots.txt ファイルでは、次の 2 つのルールを使用します:

  • User-agent: 以降のルールを適用するロボット
  • Disallow: ブロックする URL

robots.txt ファイルの各セクションは独立しており、先行のセクションには依存しません。次に例を示します:
  ...

User-agent: *
Disallow: /folder1/

User-Agent: Googlebot
Disallow: /folder2/

この例では、/folder2/ に一致する URL のみが Googlebot に対してブロックされます。

robots.txt ファイルを使用してページをブロックまたは削除する - ウェブマスター ツール ヘルプ
id:letitflow

回答ありがとうございます。

2013/09/24 15:11:55
id:windofjuly No.2

回答回数2625ベストアンサー獲得回数1149ここでベストアンサー

ポイント60pt

どこまでやるかはあなた次第ですが、
簡単なものから、やっぱり認証を利用するところまでざっくりと…。

(1)拒否を表明する

robots.txtやHTMLタグのnoindexやnofollowを使って拒否を表明する方法は、
お約束を守ってくれる大手サイト以外に効き目はありませんが、
短期間で広まってしまうことは避けられるでしょう

(2)海外からのアクセスは拒否する

htaccessにて拒否することで無意味なアクセスは防げます。
JPに割り当てられているIPアドレス範囲
http://ftp.apnic.net/stats/apnic/delegated-apnic-latest
サンプルコードを載せておられるブログ
http://wataame.sumomo.ne.jp/archives/550

上記のdelegated-apnic-latestを利用した方法では、
バイドゥなどがクロールしてくるので、
JPNIC管理下のIPアドレス範囲で許可して、
他は必要に応じて追加するほうが賢いとは思う。
https://www.nic.ad.jp/ja/dns/jp-addr-block.html

もっと確実にしたいなら(非常に面倒ではありますが)、
あなたがURLを教えた相手の利用しているプロバイダのIPアドレス範囲を調べて許可する。

(3)BASIC認証を利用する

安易には入れなくなります。
利用者が知らぬところでプロクシを通っている場合があり、
プレーンテキストでのBASIC認証に完全性を求めることはできません。

(4)認証+SSLを利用する

今のところ、一番秘匿できる方式
さくらスタンダードでは設定を変えるだけで共有SSLを利用できるので、
これを使わない手はないのかもしれません。

id:letitflow

回答ありがとうございます。
複数の対応方法をご教示いただき、助かります。

2013/09/24 15:13:09
id:TAK_TAK No.3

回答回数1136ベストアンサー獲得回数104

ポイント40pt

ウェブマスター ツールで確実に削除できます。

Google の検索結果からページやサイトを削除する

id:letitflow

回答ありがとうございます。

2013/09/24 15:13:24

コメントはまだありません

この質問への反応(ブックマークコメント)

「あの人に答えてほしい」「この質問はあの人が答えられそう」というときに、回答リクエストを送ってみてましょう。

これ以上回答リクエストを送信することはできません。制限について

回答リクエストを送信したユーザーはいません