人力検索はてな
モバイル版を表示しています。PC版はこちら
i-mobile

複数のTXTファイルから、双方に存在する文字列を、簡単に抽出するツールを探して下さい。
2chで業者の書き込みと思われるIDが、他スレで発見され、「双方に存在するIDは同一人物だ」と話題になっています。
http://hobby9.2ch.net/test/read.cgi/car/1182873919/
IDで検索するのではなく、Aスレ、Bスレ、Cスレ、があったら、Aと、Cに、同一ID:xxxxxxで、書き込みがある、という事を見つける方法です。

●質問者: umaioden
●カテゴリ:コンピュータ インターネット
✍キーワード:2ch txt スレ ファイル 存在
○ 状態 :終了
└ 回答数 : 5/5件

▽最新の回答へ

1 ● kumankuman
●8ポイント

http://www.vector.co.jp/vpack/browse/pickup/pw6/pw006375.html

◎質問者からの返答

指定文字列で検索するのではなく、

複数のTXTを開き、同一文字列を抽出するツールです。


2 ● hblm
●20ポイント

http://www.vector.co.jp/soft/win95/util/se162621.html

指定ファイル、フォルダの指定文字列を検索できます。

しかし、そんなことより必死チェッカの方が向いているのでは。

http://hissi.dyndns.ws/

◎質問者からの返答

指定文字列を検索するのではなく、

複数に存在する同一の文字列を抽出出来るツールです


3 ● ARAYOTTO
●20ポイント

http://www.vector.co.jp/soft/win95/util/se284138.html

◎質問者からの返答

文字列を検索するのではなく、

複数のファイルに共通する文字列を抽出するツールでお願いします。


4 ● quintia
●32ポイント

あなたが欲している機能はニュアンスとしてはわかるのですが、たとえその様な機能を持つソフトがあったとしても、"名無しさん"とか"2007/06/27(水)"とか">>"とか"スレ"とかが大量に引っかかるはずです(当然ですね?)。

だからそんなソフトがあったとしても、結局その結果に対して「あなたが望んでいるパターン」で検索する必要が生じるに決まっています。

それならば、最初から、同じフォルダにある複数ファイルから「あなたが望んでいるパターン」で検索するソフトで十分なんじゃないでしょうか。別の言葉で言うなら、「あなたが欲している機能を持つソフト」があってもあなたがやりたいことの役には立たないはずです(1行目に書いた理由から)。


2の回答に書かれているソフトで、

ID:[0-9a-zA-Z/+]+

あたりで検索するのが妥当ではないかと。(IDに使われる文字の範囲を知らないのでこれでは駄目かもしれませんがその辺は他の方のフォローを期待ということで)


ダミー

http://www.google.com/


5 ● quintia
●20ポイント

すみません 4.の回答者です。

寝ぼけていたみたいです。

拾い出しただけじゃファイル間で重複しているか確認できないですね。


2の回答に書かれているソフトで

.*(ID:[0-9a-zA-Z/+]+).*

を検索([ツール]-[オプション]で"正規表現検索","行単位で検索チェック"の状態で)。

\1

に置換。


http://www.vector.co.jp/soft/win95/util/se127691.html

あたりでテキスト内ソートして、ID: の行だけを残して他削除。

http://www.vector.co.jp/soft/win95/util/se113286.html

で差分確認。


……面倒ですね。ポイント不要でよいです(コメント欄があいていればそちらに書いたのですが、残念ながらコメントもトラックバックもできないので回答に入れさせてもらいました)

◎質問者からの返答

楽に出来るツールは、無いみたいですね

対象のスレッドから、IDを全部抽出して、エクセルで重複を排除したIDリストを作り、

そのIDリストを検索キーに設定して、試しに、100スレッド程、検索してみましたが、

かなりの数がヒットしました。

結構面白いです。

関連質問


●質問をもっと探す●



0.人力検索はてなトップ
8.このページを友達に紹介
9.このページの先頭へ
対応機種一覧
お問い合わせ
ヘルプ/お知らせ
ログイン
無料ユーザー登録
はてなトップ