下記のことがシェルスクリプトだけでできるかどうか教えてください。

Question

chocococoa

6

6もっと見る

95pt

コンピュータウェブ制作

下記のことがシェルスクリプトだけでできるかどうか教えてください。

apple
orange
apple
apple
orange
　：
　：

という改行区切りに単語が並んでいるリストがテキストに保存されています。
これらの単語は予測できないものとします。
このリストから

apple 5
lemon 4
orange 2

というように、出現した単語をすべてリストアップし、個数を数え、多い順に並べ替え、表示または保存する、というようなことをしたいです。
SQL で言うならば
　SELECT 単語,count(*) FROM 単語リスト GROUP BY 単語 ORDER BY count(*) DESC
と同じことを、シェルスクリプトだけで行いたいのです。

環境は RHEL または CentOS の 5.x 系で、 Web用途ではないマシンのため、各種CGIやデータベースは入れてません。
何か良いアイデアはないでしょうか。

回答の条件

1人2回まで

登録：2009/06/26 01:31:09
終了：2009/06/27 01:15:06

※ 有料アンケート・ポイント付き質問機能は2023年2月28日に終了しました。

No.2

pahoo59606332009/06/26 08:45:49

25pt

個数が冒頭に表示されても良ければ、1行でできます。

ターゲットのテキストは "hoge.txt" に記されているとします。

sort hoge.txt | uniq -c | sort -r

最低限パイプ２つあれば良いというシンプルなご回答ですね。

理解しやすいです。ありがとうございます。

2009/06/27 01:02:49

No.3

b-wind33444402009/06/26 08:52:23

20pt

$ cat sample.txt | sort | uniq -c | sort -k 2 -n -r

Manpage of SORT

Manpage of UNIQ

ありがとうございます。こちらも問題なく動きました。

ただ、 -k 2 が意味するところが良く分からないです。

2009/06/27 01:11:31

No.4

sphire115122009/06/26 09:49:23

20pt

$ cat hoge.txt | sort | uniq -c | sed 's/^ *\([0-9]*\) *\(.*\)$/\2 \1/'

ありがとうございます。 sed により表示もバッチリです。

ただ、要件の「多い順に並べ替え」ができませんでした。

2009/06/27 01:14:11

b-wind 2009/06/27 10:12:23

＞ただ、 -k 2 が意味するところが良く分からないです。
マニュアル読んだら良いと思うよ。
chocococoa 2009/06/27 11:37:06

> ＞ただ、 -k 2 が意味するところが良く分からないです。
> マニュアル読んだら良いと思うよ。

マニュアル上の解釈だと
uniq -c は [個数] [文字列] のフィールド順で出力されますから、
目的からすれば -k 2 ではなくて -k 1 なんですよね。

ところが、並べ替えの結果はちゃんと数字の多い順になっています。
ここが「良く分からない」と表現した部分です。

cat sample.txt | sort | uniq -c | sort -k 2
だとちゃんと文字列のフィールドで ABC 順になるようなので、
-n オプションがある場合 -k オプションが無視されてるような気が。
b-wind 2009/06/27 16:20:52

＞目的からすれば -k 2 ではなくて -k 1 なんですよね。
正解。つまりは自分の記述ミスでした。ゴメンナサイ。

＞並べ替えの結果はちゃんと数字の多い順になっています。
これは想定していなかったな。たまたまではないだろうか。

まぁこれだけでは申し訳ないので、大抵の環境で使えて多分早いだろう方法を。
# perl -n -e 'chomp; $h{$_}++; END { for( sort { $h{$b} <=> $h{$a} } keys %h ) { print "$_\t$h{$_}" } }' sample.txt

「あの人に答えてほしい」「この質問はあの人が答えられそう」というときに、回答リクエストを送ってみてましょう。

これ以上回答リクエストを送信することはできません。制限について

リクエスト送信済

回答リクエストを送信したユーザーはいません

andrew · Accepted Answer · 2009-06-26T04:52:29+09:00

cat FILE | sort | uniq -c | sort -nr | awk '{print $2,$1}'

で FILE に入っている単語を表示できます。

出力をファイルにリダイレクトすればファイルにも保存可能です。

andrew · Accepted Answer · 2009-06-26T04:52:29+09:00

cat FILE | sort | uniq -c | sort -nr | awk '{print $2,$1}'

で FILE に入っている単語を表示できます。

出力をファイルにリダイレクトすればファイルにも保存可能です。

下記のことがシェルスクリプトだけでできるかどうか教えてください。

ベストアンサー

andrew2522009/06/26 04:52:29

その他の回答（3件）

andrew2522009/06/26 04:52:29ここでベストアンサー

pahoo59606332009/06/26 08:45:49

b-wind33444402009/06/26 08:52:23

sphire115122009/06/26 09:49:23

コメント（3件)

この質問への反応（ブックマークコメント）