全文検索で以下のような機能を簡単に実装できる方法を探しています。

「全角・半角・ひらがな・カタカナ・漢字・アルファベットを区別なしで検索」
例えば「曹操」で検索したいとき、
そうそう・ソウソウ・ソウソウ・曹操・sousouの
いずれでも検索ヒットする方法です。

回答の条件
  • URL必須
  • 1人2回まで
  • 登録:2004/05/27 22:41:10
  • 終了:--

回答(6件)

id:taxa No.1

taxa回答回数77ベストアンサー獲得回数02004/05/27 23:20:05

ポイント15pt

URLはダミー。

結論から言うと「簡単」に実装は出来ません。

コンピュータに全ての単語や文字をあらかじめ教えておかないと絶対に検索してくれません。(漢字のデータと読み仮名をデータ化しておけばカタカナ・半角カナ・アルファベットの自動対応は可能です。)

id:kunitz

ありがとうございます!

そういうのやってくれるライブラリなどないでしょうか?

2004/05/28 07:21:43
id:garyo No.2

garyo回答回数1782ベストアンサー獲得回数962004/05/28 01:36:34

ポイント15pt

http://homepage2.nifty.com/baba_hajime/free-dic/

フリーのかな漢字変換辞書たち

「フリーのかな漢字変換辞書たち」

全角・半角・ひらがな・カタカナ・アルファベットについては日本語であれば最悪全文字分のテーブルを作成すれば変換可能でしょう。

漢字→ひらがなの変換については上記サイトで漢字辞書を探してそのデータに基づいて変換してはどうでしょうか。

「Wnn4テキスト形式」は以下のようなフォーマットなので漢字→ひらがなに変換しやすいと思います。

あおむし 青虫 名詞 0

あおもの 青物 名詞 0

あおやぎ 青柳 名詞 2

id:kunitz

ありがとうございます!

2004/05/28 07:22:00
id:ogrenavi No.3

ogrenavi回答回数161ベストアンサー獲得回数92004/05/28 13:15:10

ポイント15pt

簡単…かどうかは人によってしまいますが、全文検索エンジン+形態素解析エンジンで

ある程度可能です。

具体的には、「NAMAZU+KAKASI」「NAMAZU+ChaSen」が設置例も多く、

インストールを説明したページが多数あるので簡単だと思います。

(もちろん他の組み合わせもできます)

ただし、「曹操」のような専門用語や人物名は辞書にはいっていない可能性が高いので、

それぞれに辞書を追加する必要もあります。

KAKASIやChaSenはもちろん辞書を追加することができるので、デフォルト辞書にはいていないものを

追加すればおっしゃっている機能が実現できます。

参考URLを少しですが以下にいれておきますね。

http://www.amays.com/~mizusawa/namazu_kaisetu/index.html

マニュアルに書いてないNAMAZU

「NAMAZU+KAKASI」「NAMAZU+ChaSen」のインストール方法や、

Pearlで動くpnamazuの解説があります。

ChaSen(茶筌)

あくまでも参考ですが、

チャットにKAKASIを入れた例。

NAMAZU以外にいれたい場合に参考になると思います。

id:kunitz

ありがとうございます!

KAKASIですかー

2004/05/28 13:44:37
id:sqrt No.4

2%回答回数40ベストアンサー獲得回数02004/05/28 14:01:13

ポイント15pt

http://migemo.namazu.org/

Migemo: ローマ字のまま日本語をインクリメンタル検索

http://d.hatena.ne.jp/keyword/migemo

migemoとは - はてなキーワード

Migemoはインクリメンタル検索用のツールですが、ローマ字から漢字かな全角半角まじりの正規表現を得ることができます(リンク先のサーバが不調のようなので、Internet Archiveとダイアリーのキーワードも挙げておきます)

MigemoのC言語版C/Migemo

id:kunitz

ありがとうございます!

2004/05/28 14:06:04
id:aki73ix No.5

aki73ix回答回数5224ベストアンサー獲得回数272004/05/30 03:05:01

ポイント15pt

あいまい検索ってエンカルタなどで実装されていますよね?

例えばここの蔵書検索でも採用されています

http://www.hitachi-hec.co.jp/virnetbz/getquick/getqui01.htm

ドメイン変更のお知らせ - 日立情報制御ソリューションズ

http://www.gengokk.co.jp/thesaurus/

シソーラス(類語)検索

【あいまい検索】【シソーラス】といった辺りで調べてみると参考になると思いますよ

id:kunitz

ありがとうございます!

シソーラス

2004/05/30 16:14:14
id:garyo No.6

garyo回答回数1782ベストアンサー獲得回数962004/05/30 16:02:15

ポイント15pt

使用される言語、開発環境、検索対象は何になりますか?

EXCEL2000だと以下の関数等を利用して出来そうな気がします。

PHONETIC():漢字→ふりがな変換

ASC():全角→半角変換

JIS():半角→全角変換

CHAR():コード→文字変換

CODE():文字→コード変換

漢字、ひらがな・カタカナをローマ字に変換するワークシート

id:kunitz

ありがとうございます!

apacheとphpとmysqlでと考えています。

2004/05/30 16:14:53

コメントはまだありません

この質問への反応(ブックマークコメント)

「あの人に答えてほしい」「この質問はあの人が答えられそう」というときに、回答リクエストを送ってみてましょう。

これ以上回答リクエストを送信することはできません。制限について

絞り込み :
はてなココの「ともだち」を表示します。
回答リクエストを送信したユーザーはいません