人力検索はてな
モバイル版を表示しています。PC版はこちら
i-mobile

最新の文書のクラスタリング、分類手法などを教えて下さい


データや文章の分類、クラスタリング、類似性判断の最近の動向を教えて頂きたいと思います。
自分は研究者とかではないもので、Web上が基本的な学習の場なのですが、
分類やクラスタリングの手法を検索しても、2003年くらいの情報とか出てきます。
流石に古いのではないかと思います。
また、そうでなくても、様々な手法など書かれていますし、いったいどれが現在の主流であるのか判断がつきません。

教科書のような本に載っているのは、文書の類似性判断はユークリッド、コサイン類似度。
分類はナイーブベイズやサポートベクトル。
クラスタリングはk-means法やEMアルゴリズム。
しかし流石に、最近はもっと進化した手法を使っているのではないかと思います。
精度の面だけではなく、速度の面でも。

以前のものでも、k-means法もWillettのアルゴリズム、平均クラスタリング・アルゴリズムなど改良されたものがありました。

現在の動向、各ジャンルの主流の方法などについて教えていただけましたらありがたいです。
また、レポートやお勧めのサイトなどありましたらお願い致します。

よろしくお願いいたします。


●質問者: yujinTODO
●カテゴリ:コンピュータ 科学・統計資料
○ 状態 :キャンセル
└ 回答数 : 0/0件

回答がありません
関連質問

●質問をもっと探す●



0.人力検索はてなトップ
8.このページを友達に紹介
9.このページの先頭へ
対応機種一覧
お問い合わせ
ヘルプ/お知らせ
ログイン
無料ユーザー登録
はてなトップ