次のようなサイトでよろしいでしょうか?
http://asecuritysite.com/forensics/simstring
いろいろなアルゴリズムで文字列の類似度を算出できるようになっているようです。下の方に"Cosine Similarity"や"Euclidean Distance"があります。
http://cs.joensuu.fi/~zhao/Link/Similarity_strings.html
Levenshtein distance、Q-gram、Cosine similarity、Dice coefficientの4種類が試せるようになっています。
http://www.tools4noobs.com/online_tools/string_similarity/
ここで使用されているアルゴリズムは"An O(ND) Difference Algorithm and its Variations"と呼ばれ、diffで使用されているのと同じものなんだそうで。