mecabを利用してサイト検索のシステムを作っております。

辞書はIPAを使っているのですが、名詞など辞書にないものを追加していこうと考えております。
そこで、表記ゆれのある単語についての処理について悩んでいます。
表記ゆれについては、原形を同じにして吸収すべきなのでしょうか。

回答の条件
  • 1人2回まで
  • 登録:
  • 終了:2008/01/18 12:45:02
※ 有料アンケート・ポイント付き質問機能は2023年2月28日に終了しました。

回答1件)

id:ffmpeg No.1

回答回数1202ベストアンサー獲得回数9

ポイント60pt

むつかしい問題ですね。ただ、ほとんどのサイトでは原形吸収なんてやってないし、利用者も心得たもので、いくつか入力してみたりするので、そこまで気にすることはないかと。

http://www

id:wsada

ありがとうございます。

ただ、表記ゆれに対応する仕組みは実装せねばならないと考えています。

この分野の素人なので、いい情報があれば教えて頂ければ嬉しいです。

2008/01/13 01:46:24

コメントはまだありません

この質問への反応(ブックマークコメント)

「あの人に答えてほしい」「この質問はあの人が答えられそう」というときに、回答リクエストを送ってみてましょう。

これ以上回答リクエストを送信することはできません。制限について

回答リクエストを送信したユーザーはいません