全文検索エンジン(WebではなくDBの中を検索するタイプ)で、技術系の専門用語を素早く検索できる仕組みを作りたいのですが、そもそも、辞書を使わないで済む検索エンジンありますでしょうか。欲を言うとなるべくフリーソフトウェアのモノがありがたいです。逆に、辞書が必要なのであれば、そういった用語辞書を教えてください。宜しく御願い致します。

回答の条件
  • URL必須
  • 1人2回まで
  • 登録:2005/12/06 12:53:04
  • 終了:--

回答(4件)

id:asakura-t No.1

浅倉卓司回答回数151ベストアンサー獲得回数22005/12/06 13:00:22

ポイント40pt

Sennaはn-gramを使っていたと思うので辞書は必要ないと思います。

(なお、MySQLに組み込んで使うタイプです)

id:tankyu

情報有り難う御座いました。

n-gramを使う手法は、人間的に意味のある単語切り出しはしっかりやってくれるのでしょうか?

2005/12/07 15:38:51
id:kumaimizuki No.2

くまいみずき回答回数614ベストアンサー獲得回数312005/12/06 13:04:26

ポイント40pt

http://www.tohoho-web.com/wwwsoft.htm

とほほのCGIソフト集


CGIでもよろしいでしょうか?

でしたら、これの下から2番目にありますよ。

id:tankyu

情報有り難う御座いました。

http://www.kusastro.kyoto-u.ac.jp/~baba/wais/other-system.ht...

で調べてみます。

2005/12/07 16:07:02
id:haru1234 No.3

haru1234回答回数12ベストアンサー獲得回数02005/12/06 13:21:36

ポイント40pt

http://naoya.dyndns.org/~naoya/mt/archives/001639.html

組み込み型全文検索エンジン Senna : NDO::Weblog

辞書を使わないで、という言葉が何を指しているのか正直よく判りませんので、

DBを全文検索できるソフトについてだけ、ご紹介させていただきます。


参考URLのsennaという全文検索エンジンは「はてな」でも使われているとのことです。

ライセンスもオープンソース(GPL2)ということなので、ご希望のフリーソフトウェアという

条件にも当てはまります。

id:tankyu

一番気にしているのは、『専門用語・新しい用語・造語といったものが、検索しても引っかからない。』ことです。これを防ぎたいと考えています。宜しくお願いします。

2005/12/07 16:07:49
id:asakura-t No.4

浅倉卓司回答回数151ベストアンサー獲得回数22005/12/09 17:14:42

ポイント40pt

http://internet.watch.impress.co.jp/cda/event/2005/02/02/6320.ht...

「N-gram方式」を採用したイントラネット向け全文検索エンジン「WiSE」

 n-gramであれば、基本的に検索漏れはありません。

(単語ごとに切り分けませんから)

コメントはまだありません

この質問への反応(ブックマークコメント)

「あの人に答えてほしい」「この質問はあの人が答えられそう」というときに、回答リクエストを送ってみてましょう。

これ以上回答リクエストを送信することはできません。制限について

絞り込み :
はてなココの「ともだち」を表示します。
回答リクエストを送信したユーザーはいません