”文書類似度計算法”をブラウザ上から試してみるようなサイトを探しています。

ユークリッド距離やコサイン類似度などの文書類似度計算法をブラウザ上から試してみるようなサイトはありませんでしょうか?
レーベンシュタイン距離に関しては見つかったのですが。
http://andrew.hedges.name/experiments/levenshtein/
アドバイスいただけたらありがたいです。

回答の条件
  • 1人5回まで
  • 13歳以上
  • 登録:2013/12/22 01:58:51
  • 終了:2013/12/29 02:00:03

回答(1件)

id:fiwa No.1

fiwa回答回数1200ベストアンサー獲得回数2532013/12/22 17:47:27

次のようなサイトでよろしいでしょうか?

http://asecuritysite.com/forensics/simstring
いろいろなアルゴリズムで文字列の類似度を算出できるようになっているようです。下の方に"Cosine Similarity"や"Euclidean Distance"があります。

http://cs.joensuu.fi/~zhao/Link/Similarity_strings.html
Levenshtein distance、Q-gram、Cosine similarity、Dice coefficientの4種類が試せるようになっています。

http://www.tools4noobs.com/online_tools/string_similarity/
ここで使用されているアルゴリズムは"An O(ND) Difference Algorithm and its Variations"と呼ばれ、diffで使用されているのと同じものなんだそうで。

id:supersudo

fiwa様、本当にありがとうございました。
とても参考になりました。

しかし、このようなサイトはどのようにしてお探しになられたのでしょうか?
「xxx sample」とか色々してみましたが、自分の調べ方が悪いのか出てこなかったのですが。

2013/12/25 10:21:22
id:fiwa

たぶん"string similarity test" とか "string similarity cosine" 、"string similarity Euclidean" などのキーワードで検索したと思います。
いくつかパターンを変えてそれぞれから関係ありそうなものを拾ったはずです。

2013/12/25 12:03:39

コメントはまだありません

この質問への反応(ブックマークコメント)

「あの人に答えてほしい」「この質問はあの人が答えられそう」というときに、回答リクエストを送ってみてましょう。

これ以上回答リクエストを送信することはできません。制限について

絞り込み :
はてなココの「ともだち」を表示します。
回答リクエストを送信したユーザーはいません