mori_dev回答ポイント 300ptウォッチ 4

2つの文章の談話レベルでの類似性を定量的に算出する方法/アルゴリズムはあるでしょうか


たとえば、レーベンシュタイン距離です。
レーベンシュタイン距離の場合は、http://ja.wikipedia.org/wiki/%E3%83%AC%E3%83%BC%E3%83%99%E3%83%B3%E3%82%B7%E3%83%A5%E3%82%BF%E3%82%A4%E3%83%B3%E8%B7%9D%E9%9B%A2 を見る限り、自然言語のシンタクス/セマンティクスを考慮していないように思えます。
単語や文レベルでの類似性には信頼性がありそうですが、談話レベルでも有効なのでしょうか。
また、levenshtein gem のような、プログラミング言語 Ruby でのライブラリとして実装があれば、それも知りたいです。

※ 有料アンケート・ポイント付き質問機能は2023年2月28日に終了しました。
ログインして回答する

ベストアンサー

その他の回答

この質問へのコメント

この質問への反応(ブックマークコメント)

質問の情報

登録日時
2014-04-10 09:35:20
終了日時
2014-04-15 09:08:10
回答条件
1人5回まで

この質問のカテゴリ

この質問に含まれるキーワード

自然言語9プログラミング言語169Ruby760アルゴリズム292gem83ライブラリ985定量的53信頼性69

人気の質問

メニュー

PC版