【アクセスログ】で、除外すべきログのリストってありませんか?例えばロボットや、身内からのアクセスなんかは除外したほうがより正確なデータがわかりますよね?そういうもののリストや考え方です。

回答の条件
  • URL必須
  • 1人2回まで
  • 登録:2005/05/11 05:14:20
  • 終了:--

回答(3件)

id:stnet No.1

stnet回答回数804ベストアンサー獲得回数342005/05/11 07:13:33

ポイント24pt

http://www.robot-search.com/useragent.htm

ロボット(クロウラー/スパイダー)のUserAgent/ロボット型検索エンジン攻略でアクセスアップ

ロボットの一覧ですが、どれもちょっと最新とはいえないかも...

身内は、自分の接続IPとかドメインを除外すれば良いかと

http://bingoall.net/google/googlebot.html

Googlebot Crawlerクローラー(Google Dance)

http://tech.bayashi.net/pdmemo/ua.html

ユーザエージェント/ブラウザ

id:TomCat No.2

TomCat回答回数5402ベストアンサー獲得回数2152005/05/11 07:18:28

ポイント23pt

まずロボット関係では、最近はスパム用の

メールアドレス収集ロボットが結構多いですよね。


http://spews.org/html/S378.html

こちらがそうしたロボットの一覧です。

ただ、IPはすぐに古くなってしまいますから、

User-Agentで判断した方がいいかもしれません。


http://c-moon.jp/robots.shtml

こちらは少々書かれた時期が古いですが、

User-Agentなどの情報は概ね使えると思います。


http://www.cybersyndrome.net/

あとは、匿名プロキシ経由のアクセスを

有効なデータと考えるかどうかという問題があると思います。

匿名プロキシ使用の多くは好意的でないアクセスか、

あるいは好意的でないアクセスの「ついで」に

どこかのリンクから飛んできたなどの、

通常のサーフィンとは目的が違うアクセスでしょうから、

あまりページを読んでくれていることは期待できないと思われます。

ホスト名が引けないアクセスは、だいたい匿名串利用と考えて

間違いないものと思われます。

http://c-moon.jp/robots.shtml

robot�Ϥ¤��ˤĤ���

http://www.cybersyndrome.net/

CyberSyndrome - The Proxy Search Engine

id:shin2850 No.3

shin2850回答回数2ベストアンサー獲得回数02005/05/11 14:11:26

ポイント23pt

アクセス解析のアプリケーションが記載されていませんでしたので、詳しくお答えできませんが、こんなカンジでしょうか??


1. ご自身のネット環境が固定IP(固定グローバルIP)の環境でしたらそちらのIPを。

2. 自サイト(独自ドメインの場合は有用デス)のリファラー


最低上記のものがリストに含まれていれば問題は無いと思います。


また、ロボットを除外リストに含んでしまいますと、どのくらいの頻度でロボットのアクセスがあるというデータが取れませんので、入れないほうが良いと思います。。


参考サイトですが、webalizerやanalog等の設定の解説ページを参照くださればヒントがあると思いますよ(・∀・)ノ


また、httpdの設定がいじれる環境でしたら、下記の事をすれば管理が楽になりますよ。


1. 画像(gif・jpg・png等)のログを含まない

2. ワーム(*.exe・*.IDA等)のログを含まない

コメントはまだありません

この質問への反応(ブックマークコメント)

「あの人に答えてほしい」「この質問はあの人が答えられそう」というときに、回答リクエストを送ってみてましょう。

これ以上回答リクエストを送信することはできません。制限について

絞り込み :
はてなココの「ともだち」を表示します。
回答リクエストを送信したユーザーはいません