できれば無償のものであると(有償でも安価)ありがたいです。
ご教示のほどよろしくお願いします。
こんにちは!
テキストマイニングお勉強中の者です。
ハセテツラボ » PythonでTwitterでのツイートをネガポジ判定してみた結果。。。
検索してみたところ、こういうのが見つかりました。
手順もだいたい書いてあるので、Python書ければ追試することができそう。
RではじめるTwitter解析 - SSSSLIDE
Rもありました。
ただ、
PN Table
リンク先の中身を見ると、この絶対値だけでネガポジ判定はできない感じします。
たとえば「七夕」とかがすごくネガティブってことになってる…。
ほんとにそうなのかな…。
「RではじめるTwitter解析」のスライド後半の通り、
この値は相対的な値として見れば、ある程度得るものがあるかも。
メタデータ株式会社 Metadata Inc.
あと、商用利用不可ですが、このAPIはいい感じかもしれないです。
今回私が見つけた中ではいちばんよさそうなのですが、
まだ試せてないので、使用感はちょっとわからないです。
お仕事として本気でやるなら、研究をしている企業の協力を仰ぐことになるでしょうか。
こういう研究をしている企業はたくさんあると思いますが、
JOYSOUND ビッグデータ分析
JOYSOUNDでもやってるんですね! 楽しそう♪
Twitterだったら、カンタンなのは、
Yahoo!検索
ここにキーワードを入れてみることだと思います。
画面の右のほうにネガポジの円グラフが出ます。
「山手線」のYahoo!検索(リアルタイム) - Twitter(ツイッター)、Facebookをリアルタイム検索
たとえば「山手線」で検索すると、いまの私の環境だと
ポジが19%、ネガが33%と表示されます。
たぶん、山手線はふだん何事もなく動くことをみんな期待してるので、
わざわざツイートするときにはなにか不快なこと(遅延とか)が
あったときなのではないかと愚考しました。
ただ、今回はTwitter関係ないんですよね…。
Yahoo!以外は私今回まだ使ってないので、
実際どんな感じなのかは時間を見つけて試してみたいと思います。
SPSS Text Analytics for Surveys では分析手法として各キーワード間の関係性に着目して抽出する「係り受け分析」と、各キーワードの持つ意味に着目して抽出する「感性分析」の2種類があります。
何もなかった画面左下部分にはフリーフォーマットで記載されていたテキストから抽出されたキーワードが、その出現頻度とともに表示されているのがわかります。また右側の画面では抽出キーワードがその種類(名詞、動詞、形容詞、・・・、ポジティブ、ネガティブ、・・・)ごとに色分けされています。非定型テキストが一瞬でここまで解析できちゃいました!
https://www.ibm.com/developerworks/community/blogs/pgmrk/entry/spss_text_analytics_for_surveys__e3_82_92_e4_bd_bf_e3_81_a3_e3_81_a6_e3_81_bf_e3_81_9f3?lang=en