人力検索はてな
モバイル版を表示しています。PC版はこちら
i-mobile

テキストファイルの中に大量のキーワードがかかれているとします。その中から重複しているものを削除する方法、ツールを教えてください。

●質問者: taroemon
●カテゴリ:コンピュータ
✍キーワード:キーワード テキスト ファイル
○ 状態 :終了
└ 回答数 : 7/7件

▽最新の回答へ

1 ● kotobukiakira
●18ポイント

とりあえずメモ帳か、テキストエディタを用意しましょう。

次に、ひとつだけ残したいキーワードを、たとえば

「ほげ」

をひとつだけ残したいなら、キーワードに適当なスペースを入れて

「ほ げ」

としましょう。



次に、メニューから置換を選びます。

検索する文字列「ほげ」

置換後の文字列「」(何も書きません)

とします。

そのまますべて置換します。

この方法だと、消したくないキーワードも消えてしまうので、

紛らわしいキーワードが多い場合は、1個ずつ置換するのがよいです。


少し楽するなら、


Terapad

http://www.vector.co.jp/soft/win95/writing/se104390.html

が、連続置換に対応しているので、よいと思います。

◎質問者からの返答

ご回答ありがとうございます。

なるほど。それでもできますね。


ただどれが重複しているかもわからないほど

大量にキーワードがあるので、

重複の認識できる方法まで教えていただけるとありがたいです。


2 ● rogets
●17ポイント

コントロール+Fキーで検索をかけて用語を指定する。

あとはダブった用語を単純に削除しておわり。

この方法が一番早いので、お勧めです。

http://yahoo.co.jp

◎質問者からの返答

ご回答ありがとうございます。

なるほど。それでもできますね。


ただどれが重複しているかもわからないほど

大量にキーワードがあるので、

重複の認識できる方法まで教えていただけるとありがたいです。


3 ● ARAYOTTO
●17ポイント

http://www.vector.co.jp/soft/win95/util/se375013.html

◎質問者からの返答

ご回答ありがとうございます。

リンク先のソフトには重複キーワードについて

何もふれていないようです。

これでできるのかもしれませんが、

参考リンクだけでなく、

もう少し解説などしていただけるとうれしいです。


4 ● Richard214
●17ポイント

Mac・Winどちらを使われてるかわかりませんが、どちらにも標準で付いている様なテキストソフトで「検索・置換」で消したいキーワードを「から」のテキストに置き換えれば全て消せるのではないでしょうか。

http://nosa-nocosta.com/

◎質問者からの返答

ご回答ありがとうございます。

ほかの回答者の方と同様なので、

これがもっとも優れた検索方法なのだと理解しました。


ただ質問にもありますように、

「大量の」キーワードの中から重複しているものを削除したいので、

重複しているものを認識してくれるソフト、方法を

紹介していただけるとうれしいです。

今後お答えいただく方は上記をご配慮の上、

ご回答くださいませ。

すべての条件を満たす回答をされた方に、

なるべく多くのポイントを振り分けるようにします。


よろしくお願いします。


5 ● GEN111
●17ポイント

キーワードが keywords.txt に次のように改行で区切られているとすると

dog
cat
monkey
lion
・
・
・

コマンドプロンプトで

sort keywords.txt > new.txt

を実行。


正規表現の置換ができるソフト (例として次のものを使用)

正規表現置換(Windows95/98/Me / ユーティリティ)

で new.txt を選び、

検索部に「(.+\n)\1+」、置換部に「$1」を指定して実行


でどうでしょう。


キーワードがスペースやカンマで区切られている場合は keywords.txt を

検索部「 」(スペース)・「,」、置換部に「\n」で改行区切りにしてから sort してください。

◎質問者からの返答

ご回答ありがとうございます。


1-5件表示/7件
4.前の5件|次5件6.
関連質問


●質問をもっと探す●



0.人力検索はてなトップ
8.このページを友達に紹介
9.このページの先頭へ
対応機種一覧
お問い合わせ
ヘルプ/お知らせ
ログイン
無料ユーザー登録
はてなトップ