２つのファイルにそれぞれ文字列が入っているのですが、

Question

gatcch

5

5もっと見る

115pt

はてなの使い方コンピュータ

２つのファイルにそれぞれ文字列が入っているのですが、

これを比較して同じ文字列があった場合にその文字列を抜き出すスクリプトを教えて下さい。

ファイル１
1
1
2
3
5
8
8
8
10

ファイル２
3
3
8

の場合に、出力結果が３と８が出力されるようなスクリプト（コマンド）を探しています。

回答の条件

1人2回まで

登録：2008/07/23 02:21:40
終了：2008/07/23 11:45:00

※ 有料アンケート・ポイント付き質問機能は2023年2月28日に終了しました。

No.2

るびきち120222008/07/23 07:00:51

10pt

Rubyで。一方の行をハッシュのキーに格納し、他方の行がハッシュに含まれてるか調べる。

def compare(io1, io2)
  h = {}
  io1.readlines.each {|l| h[l] = true }
  result = []
  io2.readlines.each {|l| result << l if h.has_key? l }
  result.uniq
end

open(ARGV[0]) do |io1|
  open(ARGV[1]) do |io2|
    puts compare(io1, io2)
  end
end

色々な場合に応用できそうですね。

ありがとうございます。

2008/07/23 11:39:49

No.3

syntaxerror354562008/07/23 07:01:02

20pt

( ( sort ファイル１ | uniq ) ; ( sort ファイル２ | uniq ) ) | sort | uniq -d

unix の sort と uniq を使えばできます。

実行結果

> cat file1

1

1

2

3

5

8

8

8

10

> cat file2

3

3

8

> ( ( sort file1 | uniq ) ; ( sort file2 | uniq ) ) | sort | uniq -d

3

8

>

なるほど、各ファイルからダブった部分を消してから

再度sortして重複した部分をuniqで消すと言うことですね。

ありがとうございました。

2008/07/23 11:41:33

No.4

backupper95102008/07/23 08:24:36

25pt

以下でどうでしょう。

cat <(sort ファイル１ | uniq) <(sort ファイル２ | uniq) | grep -v '^$' | sort | uniq -d

3番の方と同じ考え方ですが、grepを使うところが面白いですね。

ありがとうございました。

2008/07/23 11:42:30

No.5

Mook13143932008/07/23 09:18:11

30pt

OS 等の情報を記載ください。

これまでの質問から UNIX・LINUX 環境での話かと思うのですが、

下記のコマンドでどうでしょうか。

cat ファイル１ | grep -f ファイル２ | sort -u

OSはLINUX環境になります。

grepの使い方がエレガントですね。

参考になりました。

2008/07/23 11:43:30

コメントはまだありません

「あの人に答えてほしい」「この質問はあの人が答えられそう」というときに、回答リクエストを送ってみてましょう。

これ以上回答リクエストを送信することはできません。制限について

リクエスト送信済

回答リクエストを送信したユーザーはいません

hujikojp · Accepted Answer · 2008-07-23T04:14:36+09:00

No.1

hujikojp10172008/07/23 04:14:36

30pt

http://en.wikipedia.org/wiki/Comm

% comm -1 -2 aaa bbb
3
8

commコマンドは知りませんでした。

参考になります。

2008/07/23 11:37:38

hujikojp · Accepted Answer · 2008-07-23T04:14:36+09:00

No.1

hujikojp10172008/07/23 04:14:36ここでベストアンサー

30pt

http://en.wikipedia.org/wiki/Comm

% comm -1 -2 aaa bbb
3
8

commコマンドは知りませんでした。

参考になります。

2008/07/23 11:37:38

２つのファイルにそれぞれ文字列が入っているのですが、

ベストアンサー

hujikojp10172008/07/23 04:14:36

その他の回答（4件）

hujikojp10172008/07/23 04:14:36ここでベストアンサー

るびきち120222008/07/23 07:00:51

syntaxerror354562008/07/23 07:01:02

backupper95102008/07/23 08:24:36

Mook13143932008/07/23 09:18:11

コメント（0件)

この質問への反応（ブックマークコメント）