apacheのアクセスログの精度について。

apacheのアクセスログを集計してみてみると、リファラに微妙におかしいデータが少し見つかりました。

「123.jpgというファイルをwww.aaaa.comから参照されている」というようなことを見ているのですが、絶対にwww.aaaa.comから参照される可能性のない、567.jpgが参照されているというようなデータがちらほら見つかります。

一部の参照元だけであれば、「参照側のサイトのミスで違うものを参照したことがあるのかな?」とも考えることができるのですが、多くの参照元で同じようなことがおきています。

※大半のログは正常な内容です。

Apacheのログ自体がたとえば参照元でなく、「直前に見ていたページのURLをリファラと勘違いする」というようなことはあるのでしょうか?

それとも、集計しているソフト(WebLog Expert)の集計結果が怪しいと考えるのがいいのでしょうか?

回答の条件
  • 1人2回まで
  • 登録:2007/08/31 13:44:45
  • 終了:2007/09/07 13:45:03

回答(4件)

id:hblm No.1

hblm回答回数243ベストアンサー獲得回数232007/08/31 14:03:01

ポイント23pt

Apacheのログ自体がたとえば参照元でなく、「直前に見ていたページのURLをリファラと勘違いする」というようなことはあるのでしょうか?

私も生ログは正確なものだと思っていますが、実際のところ、「ブラウザが勘違いしている」ということが多そうです。


直前に見ていたサイトやページのリファラを持ったまま変なアクセスをしてくる人、うちのサイトにもいますよ。

id:dingding

ありがとうございます。

ブラウザがそんな状態になるなんてことがあるんですね。

とても参考になります。ありがとうございます。

2007/08/31 17:02:20
id:b-wind No.2

b-wind回答回数3344ベストアンサー獲得回数4402007/08/31 14:03:41

ポイント23pt

Apache 自体に直前に何を見ていたかを知る方法はありません。

あくまでブラウザの自己申告でリファラとして送信してきているデータをログに出しているだけです。

ブラウザのバグなのか、意図的にあり得ない値を設定しているのかはわかりませんが、Apache ではどうしようもない部分です。

id:dingding

ブラウザのバグなんてあるんですね。とてもためになります。

2007/08/31 17:03:08
id:Sampo No.3

Sampo回答回数556ベストアンサー獲得回数1042007/08/31 15:40:50

ポイント22pt

ブラウザのプラグインやグリースモンキーの中には、既存のウェブページ上で実行されて文字列や画像へのリンクを貼り込むものがいろいろとあります。

ブラウザのバグの他に、閲覧側でページ内容が加工されていて、閲覧側では確かにその画像にリンクされているケースもあるということです。

id:dingding

グリースモンキーまで影響してくるんですか。

ためになります。

2007/08/31 17:03:40
id:KUROX No.4

KUROX回答回数3542ベストアンサー獲得回数1402007/08/31 16:05:07

ポイント22pt

>Apache 自体に直前に何を見ていたかを知る方法はありません。

>あくまでブラウザの自己申告でリファラとして送信してきて

>いるデータをログに出しているだけです。

私もそう思うというより、事実です。


推測ですが、画像だけを集めるソフトがあるんですが、

これだと適当なリファラをだすかと思います。

不自然なログのブラウザ情報を見てみてはどうでしょうか?

id:dingding

なるほど。追えるかわかりませんが、そのログのブラウザ情報を見てみます。

リファラは結構怪しいものなんですね。

ありがとうございます。

2007/08/31 17:05:00

コメントはまだありません

この質問への反応(ブックマークコメント)

「あの人に答えてほしい」「この質問はあの人が答えられそう」というときに、回答リクエストを送ってみてましょう。

これ以上回答リクエストを送信することはできません。制限について

絞り込み :
はてなココの「ともだち」を表示します。
回答リクエストを送信したユーザーはいません