ログの集計をし、上司にレポートを出したいです。

ログ形式変更不可、週1回行うので、簡単な方法で。
Windows2000で、フリーウェアほぼ利用可。

ログの形式はこんな。
000.0.00.000 - - [1/Jan/2005:00:00:00 +0900] ”GET /hoge/hoge/hoge.html HTTP/1.1” 999 99 9
左から、IPアドレス、日付、ファイル名です。
”999 99 9”は、桁数も異なる数字が各行の末尾に入っており、意味がわかりません。
2つのファイルに分かれて、毎回6,000行くらいあります。
この/hoge/hoge/hoge.htmlや、/unya/unya/unya.htmlが出てくる行数を数えてアクセス数としてレポートしたいです。

提出するレポートはエクセルで読める形式で、
/hoge/hoge/hoge.html960件
/unya/unya/unya.html1,800件
・・みたいの

数えてテキストにできればOKだと思います。
うまくいったら、一番役に立った回答に500ポイント差し上げます。

回答の条件
  • URL必須
  • 1人2回まで
  • 登録:2005/07/05 19:36:05
  • 終了:--

回答(4件)

id:Kumappus No.1

くまっぷす回答回数3784ベストアンサー獲得回数1852005/07/05 19:49:17

ポイント500pt

http://www.vector.co.jp/soft/win95/net/se252609.html

ApacheLogViewer(Windows95/98/Me / インターネット&通信)

これ、どうでしょうか。

CSVにURL別集計も吐いてくれそうです。

id:motchy55 No.2

motchy55回答回数40ベストアンサー獲得回数22005/07/05 20:23:13

ポイント50pt

集計の基準になるファイル名の部分を文字列操作関数で別のセルに抜き出したうえで、エクセルの集計機能をつかえば計算できます。

ファイル名が必ずGETとHTTPの文字に囲まれているのであれば下記の方法で対応できると思います。


1.1行目に列見出しをつくる

 A列:「ログ」 B列:「ファイル」


1.A列2行目以降にログのデータを貼り付ける


2.B2に下の数式を入力し、データの件数分くらいの行数、下方にコピーする

 =MID(A2,FIND(”GET”,A2)+3,FIND(”HTTP”,A2)-(FIND(”GET”,A2)+3))


3.数式によりB列に「GET」と「HTTP」の間の文字列が抜き出される


4.データのある部分を選択し、メニューバーの[データ]から[集計]を選択

 ダイアログに下記の指定を入力し[OK]

  グループの基準:ファイル

  集計の方法:データの個数

  集計するフィールド:ログ


一度雛形をつくって、A列のデータを更新していけば、毎回使えます。

2つのファイルに分かれているものをひとつにするには、1つめをA列2行目以降に

貼り付けたあと、最下行の次行以降に2つめのログを貼り付けてから集計します。

id:manimusu No.3

manimusu回答回数773ベストアンサー獲得回数02005/07/05 21:09:17

ポイント50pt

http://www.vector.co.jp/soft/win95/net/se170721.html

LogQuick(Windows95/98/Me / インターネット&通信)

シェアウェアですが LogQuick はどうでしょうか。

wwwサーバーのログファイルをまとめて集計してくれ、集計結果はCSV形式で保存できます

id:tks_period No.4

tks_period回答回数4ベストアンサー獲得回数02005/07/06 14:49:48

ポイント100pt

http://home.ns01.info/circle/

Circle フリーツール

Apache等で使われるNCSA形式のログのようですね。

ウェブサーバでは最もメジャーなログ形式ですのでツールも豊富です。

先に挙げたサイトは、Windows用のログ解析ツールです。

他にもログ解析関係のツールを探せばかなりいろいろな種類が見つかると思います。

http://kinshachi.ddo.jp/kurage/html/MT/comp/archives/000358.html

コンピュータ系blog: WEBのログを解析するフリーなソフト

ウェブ上に設置するならこちらで紹介されているWebalizerやanalogが有名ですね。


あと、”999 99 9” は実際には二つの数字から出来ていると思います。

一つめの3桁の数字はHTTP Status Codeで、ファイルが見つからないと404とか出てるアレです。200ならファイルが見つかって正常にデータを送ったという事です。

二個目の数字は送ったデータのサイズですね。例えば10KBの写真をダウンロードしたログの場合、10240と書かれていると思います。

  • id:tks_period
    ありゃりゃ

    ApacheLogViewer、Kumappusさんが先に紹介されてましたね。
    重複してしまってすいませんでした。

この質問への反応(ブックマークコメント)

「あの人に答えてほしい」「この質問はあの人が答えられそう」というときに、回答リクエストを送ってみてましょう。

これ以上回答リクエストを送信することはできません。制限について

絞り込み :
はてなココの「ともだち」を表示します。
回答リクエストを送信したユーザーはいません