人力検索はてな
モバイル版を表示しています。PC版はこちら
i-mobile

【アクセスログ】で、除外すべきログのリストってありませんか?例えばロボットや、身内からのアクセスなんかは除外したほうがより正確なデータがわかりますよね?そういうもののリストや考え方です。

●質問者: babatakagi
●カテゴリ:ウェブ制作
✍キーワード:アクセス アクセスログ データ リスト ログ
○ 状態 :終了
└ 回答数 : 3/3件

▽最新の回答へ

1 ● stnet
●24ポイント

http://www.robot-search.com/useragent.htm

ロボット(クロウラー/スパイダー)のUserAgent/ロボット型検索エンジン攻略でアクセスアップ

ロボットの一覧ですが、どれもちょっと最新とはいえないかも...

身内は、自分の接続IPとかドメインを除外すれば良いかと

http://bingoall.net/google/googlebot.html

Googlebot Crawlerクローラー(Google Dance)

http://tech.bayashi.net/pdmemo/ua.html

ユーザエージェント/ブラウザ


2 ● TomCat
●23ポイント

http://spews.org/html/S378.html

まずロボット関係では、最近はスパム用の

メールアドレス収集ロボットが結構多いですよね。


http://spews.org/html/S378.html

こちらがそうしたロボットの一覧です。

ただ、IPはすぐに古くなってしまいますから、

User-Agentで判断した方がいいかもしれません。


http://c-moon.jp/robots.shtml

こちらは少々書かれた時期が古いですが、

User-Agentなどの情報は概ね使えると思います。


http://www.cybersyndrome.net/

あとは、匿名プロキシ経由のアクセスを

有効なデータと考えるかどうかという問題があると思います。

匿名プロキシ使用の多くは好意的でないアクセスか、

あるいは好意的でないアクセスの「ついで」に

どこかのリンクから飛んできたなどの、

通常のサーフィンとは目的が違うアクセスでしょうから、

あまりページを読んでくれていることは期待できないと思われます。

ホスト名が引けないアクセスは、だいたい匿名串利用と考えて

間違いないものと思われます。

http://c-moon.jp/robots.shtml

robot??????????

http://www.cybersyndrome.net/

CyberSyndrome - The Proxy Search Engine


3 ● shin2850
●23ポイント

アクセス解析のアプリケーションが記載されていませんでしたので、詳しくお答えできませんが、こんなカンジでしょうか??


1. ご自身のネット環境が固定IP(固定グローバルIP)の環境でしたらそちらのIPを。

2. 自サイト(独自ドメインの場合は有用デス)のリファラー


最低上記のものがリストに含まれていれば問題は無いと思います。


また、ロボットを除外リストに含んでしまいますと、どのくらいの頻度でロボットのアクセスがあるというデータが取れませんので、入れないほうが良いと思います。。


参考サイトですが、webalizerやanalog等の設定の解説ページを参照くださればヒントがあると思いますよ(・∀・)ノ


また、httpdの設定がいじれる環境でしたら、下記の事をすれば管理が楽になりますよ。


1. 画像(gif・jpg・png等)のログを含まない

2. ワーム(*.exe・*.IDA等)のログを含まない

関連質問


●質問をもっと探す●



0.人力検索はてなトップ
8.このページを友達に紹介
9.このページの先頭へ
対応機種一覧
お問い合わせ
ヘルプ/お知らせ
ログイン
無料ユーザー登録
はてなトップ