また、様々なキーワードの中から名詞のみを抜き出してると思うのですがこれについても知りたいです。
質問にダイレクトな回答になってませんが、参考に
なればと思います。
-------------------------------------------
http://gensen.dl.itc.u-tokyo.ac.jp/termextract.html
キーワード抽出モジュールに関してかかれています。
このURLの文章の中で定番が「茶筅」とかかれています。
http://chasen.naist.jp/hiki/ChaSen/
----------------------------------------
はてなさんは、perlで実装してるような気がしますが、
本当のところは私は知りません。
通常、形態素解析ということをしています。
http://ja.wikipedia.org/wiki/%E5%BD%A2%E6%85%8B%E7%B4%A0%E8%A7%A...
上記のページの「入手可能な日本語の形態素解析エンジン」が参考になるのではないかと思います。
コメント(0件)