自サイト内のHTML文書検索用のCGIスクリプトでフリーのものを探しています。<br />

<条件><br />
・HTMLのタイトル(日本語)のみが検索対象。<br />
・対象文書の文字コードはUTF-8。<br />
・ファイル数は2万個程度。<br />
・逐次検索ではなく、インデックス生成型。<br />
・NAMAZU以外。<br />

回答の条件
  • URL必須
  • 1人2回まで
  • 登録:2004/06/11 07:17:51
  • 終了:--

回答(2件)

id:cx20 No.1

cx20回答回数607ベストアンサー獲得回数1082004/06/11 08:03:08

ポイント40pt

「Unicode版msearch」というのがあるようです。

http://www.hatena.ne.jp/1086835764

HPに設置するとHTML内の文字を探し出してくれるスクリプトを探しています。http://CGIScriptMarket.com/さんのSite_Searchのようなものです。 希望は、 決められたディレク.. - 人力検索はてな

似たような質問がありましたので参考まで。

id:ransamu

ありがとうございます。

本家のmsearchは知っていたのですが、UTF-8が未対応だったので他を探していました。

改造版があったのですね、気づきませんでした。

2004/06/11 08:12:02
id:snitch No.2

snitch回答回数516ベストアンサー獲得回数92004/06/11 12:54:44

ポイント30pt

確かにNamazuは今のところUTF-8に対応していませんね。将来的には対応する考想はあるようですが・・・

本題ですがバージョン4.1からUTF-8に対応したHPのMitakeSearchはどうでしょうか?

ただ、フリーライセンス版は1万ファイルまでなので、ワークグループモデルを買う必要があります。

(フリーではなくてごめんなさい)

http://estraier.sourceforge.net/spex-ja.html

Specifications of Estraier Version 1 (Japanese)

あとは、Estraierというものがあります。

作者は日本人の平林幹雄氏です。

id:ransamu

ありがとうございます。

2004/06/11 20:05:13

コメントはまだありません

この質問への反応(ブックマークコメント)

「あの人に答えてほしい」「この質問はあの人が答えられそう」というときに、回答リクエストを送ってみてましょう。

これ以上回答リクエストを送信することはできません。制限について

絞り込み :
はてなココの「ともだち」を表示します。
回答リクエストを送信したユーザーはいません