人力検索はてな
モバイル版を表示しています。PC版はこちら
i-mobile

”文書類似度計算法”をブラウザ上から試してみるようなサイトを探しています。
ユークリッド距離やコサイン類似度などの文書類似度計算法をブラウザ上から試してみるようなサイトはありませんでしょうか?
レーベンシュタイン距離に関しては見つかったのですが。
http://andrew.hedges.name/experiments/levenshtein/
アドバイスいただけたらありがたいです。

●質問者: yujinTODO
●カテゴリ:コンピュータ 学習・教育
○ 状態 :終了
└ 回答数 : 1/1件

▽最新の回答へ

1 ● fiwa

次のようなサイトでよろしいでしょうか?

http://asecuritysite.com/forensics/simstring
いろいろなアルゴリズムで文字列の類似度を算出できるようになっているようです。下の方に"Cosine Similarity"や"Euclidean Distance"があります。

http://cs.joensuu.fi/~zhao/Link/Similarity_strings.html
Levenshtein distance、Q-gram、Cosine similarity、Dice coefficientの4種類が試せるようになっています。

http://www.tools4noobs.com/online_tools/string_similarity/
ここで使用されているアルゴリズムは"An O(ND) Difference Algorithm and its Variations"と呼ばれ、diffで使用されているのと同じものなんだそうで。


yujinTODOさんのコメント
fiwa様、本当にありがとうございました。 とても参考になりました。 しかし、このようなサイトはどのようにしてお探しになられたのでしょうか? 「xxx sample」とか色々してみましたが、自分の調べ方が悪いのか出てこなかったのですが。

fiwaさんのコメント
たぶん"string similarity test" とか "string similarity cosine" 、"string similarity Euclidean" などのキーワードで検索したと思います。 いくつかパターンを変えてそれぞれから関係ありそうなものを拾ったはずです。
関連質問

●質問をもっと探す●



0.人力検索はてなトップ
8.このページを友達に紹介
9.このページの先頭へ
対応機種一覧
お問い合わせ
ヘルプ/お知らせ
ログイン
無料ユーザー登録
はてなトップ