テキストファイルの中に大量のキーワードがかかれているとします。その中から重複しているものを削除する方法、ツールを教えてください。

回答の条件
  • URL必須
  • 1人2回まで
  • 登録:2007/05/01 15:22:13
  • 終了:2007/05/08 10:05:55

回答(7件)

id:kotobukiakira No.1

kotobukiakira回答回数13ベストアンサー獲得回数02007/05/01 17:17:24

ポイント18pt

とりあえずメモ帳か、テキストエディタを用意しましょう。

次に、ひとつだけ残したいキーワードを、たとえば

「ほげ」

をひとつだけ残したいなら、キーワードに適当なスペースを入れて

「ほ げ」

としましょう。



次に、メニューから置換を選びます。

検索する文字列「ほげ」

置換後の文字列「」(何も書きません)

とします。

そのまますべて置換します。

この方法だと、消したくないキーワードも消えてしまうので、

紛らわしいキーワードが多い場合は、1個ずつ置換するのがよいです。


少し楽するなら、


Terapad

http://www.vector.co.jp/soft/win95/writing/se104390.html

が、連続置換に対応しているので、よいと思います。

id:taroemon

ご回答ありがとうございます。

なるほど。それでもできますね。


ただどれが重複しているかもわからないほど

大量にキーワードがあるので、

重複の認識できる方法まで教えていただけるとありがたいです。

2007/05/02 02:06:10
id:rogets No.2

rogets回答回数114ベストアンサー獲得回数82007/05/01 17:35:51

ポイント17pt

コントロール+Fキーで検索をかけて用語を指定する。

あとはダブった用語を単純に削除しておわり。

この方法が一番早いので、お勧めです。

http://yahoo.co.jp

id:taroemon

ご回答ありがとうございます。

なるほど。それでもできますね。


ただどれが重複しているかもわからないほど

大量にキーワードがあるので、

重複の認識できる方法まで教えていただけるとありがたいです。

2007/05/02 02:06:45
id:ARAYOTTO No.3

ARAYOTTO回答回数1377ベストアンサー獲得回数132007/05/01 17:49:26

id:taroemon

ご回答ありがとうございます。

リンク先のソフトには重複キーワードについて

何もふれていないようです。

これでできるのかもしれませんが、

参考リンクだけでなく、

もう少し解説などしていただけるとうれしいです。

2007/05/02 02:10:28
id:Richard214 No.4

Richard214回答回数119ベストアンサー獲得回数12007/05/01 19:39:38

ポイント17pt

Mac・Winどちらを使われてるかわかりませんが、どちらにも標準で付いている様なテキストソフトで「検索・置換」で消したいキーワードを「から」のテキストに置き換えれば全て消せるのではないでしょうか。

http://nosa-nocosta.com/

id:taroemon

ご回答ありがとうございます。

ほかの回答者の方と同様なので、

これがもっとも優れた検索方法なのだと理解しました。


ただ質問にもありますように、

「大量の」キーワードの中から重複しているものを削除したいので、

重複しているものを認識してくれるソフト、方法を

紹介していただけるとうれしいです。

今後お答えいただく方は上記をご配慮の上、

ご回答くださいませ。

すべての条件を満たす回答をされた方に、

なるべく多くのポイントを振り分けるようにします。


よろしくお願いします。

2007/05/02 02:14:24
id:GEN111 No.5

GEN111回答回数472ベストアンサー獲得回数582007/05/02 17:07:36

ポイント17pt

キーワードが keywords.txt に次のように改行で区切られているとすると

dog
cat
monkey
lion
・
・
・

コマンドプロンプトで

sort keywords.txt > new.txt

を実行。


正規表現の置換ができるソフト (例として次のものを使用)

正規表現置換(Windows95/98/Me / ユーティリティ)

で new.txt を選び、

検索部に「(.+\n)\1+」、置換部に「$1」を指定して実行


でどうでしょう。


キーワードがスペースやカンマで区切られている場合は keywords.txt を

検索部「 」(スペース)・「,」、置換部に「\n」で改行区切りにしてから sort してください。

id:taroemon

ご回答ありがとうございます。

2007/05/07 14:34:16
id:wata_kazu2005 No.6

wata_kazu2005回答回数11ベストアンサー獲得回数12007/05/06 15:40:43

ポイント17pt

accessが使える環境であればSQLを書くことで下記のような方法があります。


テキストファイルのキーワードが下記のように並んでいる前提


キーワード1

キーワード2

キーワード3

・・・

キーワードnー1

キーワードn


手順:

a) テキストファイルをaccessのテーブルへインポート

b) クエリをselect distinctにて作成

http://www.nurs.or.jp/~ppoy/access/access/acQ005.html

c) 検索結果をテキストファイルへコピー

id:taroemon

ご回答ありがとうございます。

2007/05/07 14:34:19
id:kiri0710 No.7

kiri0710回答回数1ベストアンサー獲得回数02007/05/07 16:59:49

ポイント17pt

試したことはないのですが、「Just Right!2」のような文章構成支援ツールを使うとできるかもしれません。

「Just Right!2」

http://www.justsystem.co.jp/justright/advtg.html

「ご購入前のご相談」

http://www.justsystem.co.jp/if/

id:taroemon

ご回答ありがとうございます。

2007/05/08 10:05:24

コメントはまだありません

この質問への反応(ブックマークコメント)

「あの人に答えてほしい」「この質問はあの人が答えられそう」というときに、回答リクエストを送ってみてましょう。

これ以上回答リクエストを送信することはできません。制限について

絞り込み :
はてなココの「ともだち」を表示します。
回答リクエストを送信したユーザーはいません