経営大学院における研究活動のため、「テキスト分析ツール」を探しております。

統計学の世界でのSPSSのように、テキスト分析における代表的なツールというものが存在するのでしょうか。どのようなツールが適切なのかわからず、皆様のお知恵を拝借したくメールさせて頂いた次第です。
下記条件に当てはまるテキスト分析ツールをご存知でしたら、お教え頂けませんでしょうか。
①英語対応可。(ユーザーインタフェースが英語表示可能なだけでなく、英語データの読み取りが可能)
②最低限やりたいことは、膨大なテキストファイル(.txt)から、特定のキーワードの登場頻度を数えること。
③できれば、キーワードとキーワードの相関関係の分析。(相関関係にも色々ありますが、、、)
④費用ですが、フリーソフトであれば最も嬉しいです。。。

皆様、ご多忙のところ恐れ入りますが、おすすめの分析ツールがございましたら、是非ご教示頂けましたら幸いに存じます。

回答の条件
  • 1人5回まで
  • 13歳以上
  • 登録:2012/10/08 23:30:52
  • 終了:2012/10/15 23:35:03

回答(4件)

id:oil999 No.1

oil999回答回数1728ベストアンサー獲得回数3202012/10/09 06:28:29

ポイント25pt

SPSSのシリーズ製品として IBM SPSS Text Analytics for Surveys があります。
http://www-06.ibm.com/software/jp/analytics/spss/store/stats/pasw.html

フリーソフトですと、Rを使ったテキストマイニングツールが出回っています。
http://ipintelligence.blog.so-net.ne.jp/2010-01-23

id:sanada33 No.3

みかん回答回数293ベストアンサー獲得回数32012/10/09 19:37:57

ポイント25pt

データ解析やデータマイニングは定型化したデータを対象としている。データの定型化とは、研究対象の特徴を項目(変数)ごとに分け、表形式(あるいは配列形式)にまとめたものを指す。しかし、われわれの周辺の多くのデータは定型化されていない。
 定型化されていないデータの最も典型的な例は、文章(あるいは文書)である。文章とは、何らかの文字列が一定の文法規則に基づいた文の集合体を指す。従って、日記、小説、新聞記事、メール、ブログ文、演説文などは文章と呼ぶが、メーリングリストのログ、遺伝子やウイルスの情報を記号列で表記したものを文章と呼ぶには違和感を持つ方も少なくないようである。そこで、本稿では、記号列が何らかの規則に従って並べられた集合体をテキストと呼ぶことにする。 情報システムの普及とあいまって、テキストデータが急速に増加している。対象を絞っても一つ一つ目を通して分析するのは時間と労力がかかり、効率的に活用することが困難である。また、人によっては認識や解釈などが異なることもあり、テキストを定量的に解析することが求められている。
 定型化されていないテキストは単語やフレーズ、何らかの単位に分割し、それらの出現頻度や共起関係(同時出現)などを抽出し、データ解析やデータマイニングの手法で定量的に解析することができる。その分野を計算的テキスト解析(computational text analysis)、あるいは統計的テキスト解析(statistical text analysis)を呼ぶが、情報処理やビジネス分野では、テキストマイニング(text mining)と呼ばれている。
 近年このようなアプローチが市民権を得つつある。その例として、NHKで放映された平成19年10月1日夜のニュース番組の内容を紹介する。 衆知のように、平成19年9月12日、所信表明のわずか2日後に安部総理が突然辞任を表明し、安倍政権は1年足らずで幕を降ろした。1ヶ月足らずの時間を経て、福田康夫衆議院議員が内閣総理大臣に任命され、平成19年10月1日に所信表明演説を行った。当日夜のNHKのニュース番組では、安倍元総理の所信表明演説(平成18年9月29日)と福田総理の所信表明演説(平成19年10月1日)に用いられた3つの単語(改革、安定、安心)の頻度を用いて、分析・評論を行った。そのデータを表1に示す。

id:watercooler No.4

井戸端さん回答回数289ベストアンサー獲得回数512012/10/14 07:59:52

ポイント25pt

私のお勧めはこれよ日本語の分かち書きもやってくれるので便利♪
http://khc.sourceforge.net/
概要はチュートリアルを見てくださいね。
http://jaist.dl.sourceforge.net/project/khc/Tutorial/for%20KH%20Coder%202.x/khcoder_tutorial.pdf

コメントはまだありません

この質問への反応(ブックマークコメント)

「あの人に答えてほしい」「この質問はあの人が答えられそう」というときに、回答リクエストを送ってみてましょう。

これ以上回答リクエストを送信することはできません。制限について

絞り込み :
はてなココの「ともだち」を表示します。
回答リクエストを送信したユーザーはいません