アクセスログに関する質問です。perl でアクセスログをCSVにするプログラムはできているのですが、検索エンジンの部分の細かい解析をする正規表現や、漢字変換のツールができていません。そういったものでよくできたライブラリというか関数というかあるでしょうか?言語は、perl でもPHPでも構いません.漢字の変換等がやっかいなのです。

回答の条件
  • URL必須
  • 1人2回まで
  • 登録:2004/12/04 12:21:14
  • 終了:--

回答(1件)

id:GEN111 No.1

GEN111回答回数472ベストアンサー獲得回数582004/12/04 13:07:19

ポイント50pt

たとえば Perl では

$str = ’

’ ;

$str =~ s/%([A-Fa-f0-9][A-Fa-f0-9])/pack(”C”, hex($1))/eg ;

で %82%CD%82%C4%82%C8 が Shift_JIS の「はてな」に変換されます。

これを jcode.pl や Jcodeモジュール で Shift_JIS なり EUC なりに変換してやると良いでしょう。

id:isogaya

もちろん、この程度はできるのですが、検索エンジンの種類がいろいろあって、処理をきちんとやってくれるようなライブリでできあいのものがあったらそれをつかってゆきたいのです。

2004/12/09 09:54:08

コメントはまだありません

この質問への反応(ブックマークコメント)

「あの人に答えてほしい」「この質問はあの人が答えられそう」というときに、回答リクエストを送ってみてましょう。

これ以上回答リクエストを送信することはできません。制限について

絞り込み :
はてなココの「ともだち」を表示します。
回答リクエストを送信したユーザーはいません