形態素解析の技術を使って、ファイルから、品詞(名詞)を取出したいのですが、

なかなかいい方法が見つからず困っています。

7~8年前に、「BreakFastの実行」というフリーソフト
<http://www.vector.co.jp/soft/win95/edu/se078125.html>
を使ったことがあり、その時は使えたのですが、現在は、これを
ダウンロードして実行しても、BreakFastの実行ファイルである
「cbf.exe」がネットを探しても見当たりません。

そこで、
(1)「cbf.exe」を入手する方法
(2)「BreakFastの実行」以外で、形態素解析で品詞(名詞)
   を抽出する事ができるソフト
があったら教えて頂けますでしょうか。

動作環境は、WindowsXPです。GUIで操作できるものがいいです。

よろしくお願いいたします。

回答の条件
  • URL必須
  • 1人2回まで
  • 登録:
  • 終了:2010/08/16 09:26:26
※ 有料アンケート・ポイント付き質問機能は2023年2月28日に終了しました。

ベストアンサー

id:init_d No.6

回答回数2ベストアンサー獲得回数1

ポイント18pt

(1)についてのみですが。

http://www.tufs.ac.jp/ts/personal/motizuki/old/lecture/cp2k61/20...

を見ると、遅くとも2006/05/15の時点で富士通からの配布は終了しているようですね。

cbf.exeは

http://www.tanimoto.to/nlp/index.html#Breakfast

からダウンロードできるbfw404f.tarに含まれているようです。

id:stepwgn24z

bfw404f.tarに含まれているのですね。解凍方法調べてこれも試してみます。ありがとうございます。

2010/08/16 09:26:03

その他の回答5件)

id:yamaneroom No.1

回答回数1040ベストアンサー獲得回数61

id:stepwgn24z

茶筌というのが有るのですね。ダウンロードして試してみます。

2010/08/16 09:23:11
id:gappa No.2

回答回数23ベストアンサー獲得回数3

ポイント19pt

いまだったら形態素解析はMeCabでしょうか

MeCab: Yet Another Part-of-Speech and Morphological Analyzer

 http://mecab.sourceforge.net/

 http://www.tokuteicorpus.jp/dist/

茶筌は古すぎますね。なぜ推してるのか判らん。

id:stepwgn24z

こちらも試してみます。ありがとうございます。

2010/08/16 09:23:21
id:ymlab No.3

回答回数508ベストアンサー獲得回数34

ポイント18pt

id:yamaneroom さんの茶筅でもよいのですが、[私はもともとLinuxですぐインストールできるOr もともとついてた] kakasi を使っていました。

最近では、Mecabというとても便利なライブラリがあります。

http://mecab.sourceforge.net/

私はWeblogの文字を入力したときに文字列を分割してふりがなを自動的に作るシステムをWebAPI化させたときに使いました。

実際にダウンロードしてみるとお分かりだと思うのですが、とても扱いやすいです。

残念ながら、GUI操作はできません・・・。

id:stepwgn24z

GUI操作ができないのが残念ですね。でも参考にさせて頂きます。

どうもありがとうございました。

2010/08/16 09:24:19
id:yamaneroom No.4

回答回数1040ベストアンサー獲得回数61

ポイント18pt

茶筌はWindows用GUIプログラムWinChaがあるから推しているのだが、

なぜ他の人は質問者の意向に反するCUIツールを回答するのか、はなはだ疑問である。

http://q.hatena.ne.jp/

id:stepwgn24z

WinChaと組み合わせて使うのですね。試してみます。ありがとうございます。

2010/08/16 09:24:55
id:gappa No.5

回答回数23ベストアンサー獲得回数3

ポイント18pt

>なぜ他の人は質問者の意向に反するCUIツールを回答するのか、はなはだ疑問である。

 

えーと、

>>http://www.tokuteicorpus.jp/dist/

>関連ツールとして,数字の読みなどを正しく解析するための変換用スタイルシート「NumTrans」「ChaOne」,解析のためのGUI「茶まめ」(Windows版のみ)を公開しています。

とGUIツールも含んでおります。

 

yamaneroomさんは、他人を非難される前にちゃんと確認した方がいいですね。

id:stepwgn24z

色々と組み合わせて使うのですね。試してみます。

2010/08/16 09:25:32
id:init_d No.6

回答回数2ベストアンサー獲得回数1ここでベストアンサー

ポイント18pt

(1)についてのみですが。

http://www.tufs.ac.jp/ts/personal/motizuki/old/lecture/cp2k61/20...

を見ると、遅くとも2006/05/15の時点で富士通からの配布は終了しているようですね。

cbf.exeは

http://www.tanimoto.to/nlp/index.html#Breakfast

からダウンロードできるbfw404f.tarに含まれているようです。

id:stepwgn24z

bfw404f.tarに含まれているのですね。解凍方法調べてこれも試してみます。ありがとうございます。

2010/08/16 09:26:03

コメントはまだありません

この質問への反応(ブックマークコメント)

「あの人に答えてほしい」「この質問はあの人が答えられそう」というときに、回答リクエストを送ってみてましょう。

これ以上回答リクエストを送信することはできません。制限について

回答リクエストを送信したユーザーはいません