人力検索はてな
モバイル版を表示しています。PC版はこちら
i-mobile

数日分の生ログをもとに、あるページの日別アクセス数を出したいのですが、どうすればいいでしょうか?

出したいのは、

http://ドメイン名/フォルダ名/ またはhttp://ドメイン名/フォルダ名/index.html へのアクセスです。

http://ドメイン名/フォルダ名/ページ名.htmlのデータは必要ありません。

analogを利用して、http://ドメイン名/フォルダ名/まで絞り込むことはできましたが、これだと他のページが混ざってしまいます。

最悪、自分でエクセルにでも落としてちまちまと数えるしかないと思っているんですが、できれば一発で簡単に出ると嬉しいです。

よろしくお願いします。

●質問者: nekogo
●カテゴリ:コンピュータ
✍キーワード:analog HTML http:// INDEX アクセス
○ 状態 :終了
└ 回答数 : 3/3件

▽最新の回答へ

1 ● ponta3rd
●20ポイント

http://www.hatena.ne.jp/1089025726#

数日分の生ログをもとに、あるページの日別アクセス数を出したいのですが、どうすればいいでしょうか? 出したいのは、 http://ドメイン名/フォルダ名/ またはhttp://ドメ.. - 人力検索はてな

秀丸を使用して、このような方法ではどうでしょうか。

1.ログファイルを対象に、”/¥n”をgrep(正規表現)

2.同じくログファイルを対象に、”/index.html¥n”をgrep(正規表現)

結果からボックス切り取りをして、いらないところをなくし、できたファイルをanalogかける。

(見たいなスクリプトを作成して別途抜き出すでも良いと思います)

excelでちまちまカウントするよりは早いのではないでしょうか。

◎質問者からの返答

ありがとうございます。

明日やってみます(*^^*)


2 ● aki73ix
●20ポイント

http://www.vector.co.jp/soft/dl/dos/util/se016423.html

jgrep スリム & MS-DOS汎用版(MS-DOS / ユーティリティ)

http://www.vector.co.jp/soft/dos/util/se004157.html

wc(MS-DOS / ユーティリティ)

grep と wcを使うと簡単です

grep は正規化で特定の文字列を含む行、もしくは含まない行を抽出できます

grep ”http://ドメイン名/フォルダ名/ ” 生ログ> file1.txt

grep -v ”http://ドメイン名/フォルダ名/ ” 生ログ> file2.txt

最初”フォルダ名/ ”の後ろにスペースがあれば簡単に抽出できます

file1.txtに http://ドメイン名/フォルダ名/

を取り出した後

file2.txtにそれ以外の部分を抽出します

さらに

grep -v ”http://ドメイン名/フォルダ名/index.htm” file2.txt> file3.txt

にして

wc file1.txt

wc file3.txt

として、行数を足してやればアクセス数が出ます(WCはファイルの行数や単語数を数えるコマンドです)

◎質問者からの返答

いつもありがとうございます。

明日試してみます(*^^*)


3 ● paxil
●20ポイント

http://www.cygwin.com/

Cygwin Information and Installation

私なら、cygwinでgrepやawkを使ってログを切出して、行数をwcで数えます。

◎質問者からの返答

ありがとうございます。

明日、試してみます(*^^*)

関連質問


●質問をもっと探す●



0.人力検索はてなトップ
8.このページを友達に紹介
9.このページの先頭へ
対応機種一覧
お問い合わせ
ヘルプ/お知らせ
ログイン
無料ユーザー登録
はてなトップ