人力検索はてな
モバイル版を表示しています。PC版はこちら
i-mobile

ある文章中に出現する単語の出現回数を、自動的に抽出して上位からランクをつけてくれるソフトはありませんか?

表計算やデータベース(FileMakerを使っています)でも、字句を指定してやればカウントしてくれますが、自動で単語カウントして上位から表示してくれるようなソフトを探しています。

●質問者: しましま
●カテゴリ:コンピュータ
✍キーワード:FileMaker カウント ソフト データベース ランク
○ 状態 :終了
└ 回答数 : 2/2件

▽最新の回答へ

1 ● kanan5100
●40ポイント

http://www.madin.jp/docs/wordcount.html

http://sakaguch.com/hindo.html

http://www.vector.co.jp/soft/win95/util/se387976.html

こういうのでしょうか?

googleで"単語 出現頻度"で検索するといろいろ出てきます。

◎質問者からの返答

すばらしい。

同じコトを考えている人はやはりいるのですね。


2 ● tanukichi800
●30ポイント

出来合いのソフトを探してるんでしたら申し訳ないですが・・

方法としてはchasen + perlが王道でしょうね。

どちらもWindows用も用意されています。


chasenについて参考

http://journal.mycom.co.jp/column/yetanother/045/


あらかじめchasenで1行1単語に区切ったファイルを作っておいて下記のPerlスクリプトに食わせればいいと思います。

なお、ファイルがあまりに巨大な場合は時間とメモリが要りますから別の方法が必要です。


#!/usr/bin/perl


# chasenで区切っておいたファイルの名前

$textfile = "sample.txt";


# 集計

%words = ();

open(TXT,$textfile);

while(<TXT>){

chomp;

if(!$words{$_}){

$words{$_} = 1;

}else{

$words{$_}++;

}

}

close(TXT);


# 結果表示

foreach(keys %words){

print "$_ : $words{$_}回\n";

}


exit;

◎質問者からの返答

perlはやったことがないのですが、

参考になりました。

ありがとうございました。

関連質問


●質問をもっと探す●



0.人力検索はてなトップ
8.このページを友達に紹介
9.このページの先頭へ
対応機種一覧
お問い合わせ
ヘルプ/お知らせ
ログイン
無料ユーザー登録
はてなトップ