mecabを利用してサイト検索のシステムを作っております。

辞書はIPAを使っているのですが、名詞など辞書にないものを追加していこうと考えております。
そこで、表記ゆれのある単語についての処理について悩んでいます。
表記ゆれについては、原形を同じにして吸収すべきなのでしょうか。

回答の条件
  • 1人2回まで
  • 登録:2008/01/11 12:40:45
  • 終了:2008/01/18 12:45:02

回答(1件)

id:ffmpeg No.1

ffmpeg回答回数1202ベストアンサー獲得回数92008/01/13 00:48:23

ポイント60pt

むつかしい問題ですね。ただ、ほとんどのサイトでは原形吸収なんてやってないし、利用者も心得たもので、いくつか入力してみたりするので、そこまで気にすることはないかと。

http://www

id:wsada

ありがとうございます。

ただ、表記ゆれに対応する仕組みは実装せねばならないと考えています。

この分野の素人なので、いい情報があれば教えて頂ければ嬉しいです。

2008/01/13 01:46:24

コメントはまだありません

この質問への反応(ブックマークコメント)

「あの人に答えてほしい」「この質問はあの人が答えられそう」というときに、回答リクエストを送ってみてましょう。

これ以上回答リクエストを送信することはできません。制限について

絞り込み :
はてなココの「ともだち」を表示します。
回答リクエストを送信したユーザーはいません