アイディアをください。

英文のtxtファイルが100程度あるのですが、この中から
任意の動詞や名詞を検索したいです。
このファイルのこの部分にこの動詞があるというのを
すばやく検索できるよい方法があれば教えてください。

回答の条件
  • 1人2回まで
  • 登録:2008/01/11 14:12:43
  • 終了:2008/01/18 14:15:02

回答(9件)

id:president_kuma No.1

president_kuma回答回数14ベストアンサー獲得回数22008/01/11 14:16:41

ポイント19pt

探三郎というフリーソフトが、各ファイルの文中まで調査してくれて良い感じです。

http://www.geocities.jp/koutarou_y1926/

id:taro707

ありがとうございます。試してみましたが

私のPC環境ではエラーがでてしまいました。

2008/01/11 15:26:30
id:fuentebella No.2

fuentebella回答回数269ベストアンサー獲得回数302008/01/11 14:23:13

id:taro707

ありがとうございます。

このソフトについてわからない部分があるので

次の質問をみていただけると幸いです

2008/01/11 15:27:04
id:Mook No.3

Mook回答回数1312ベストアンサー獲得回数3912008/01/11 14:24:33

ポイント18pt

構文解析はしないので、厳密な意味での動詞、名詞を検索するわけではありませんが、

下記のように複数ファイルから、文字列の検索を実行するツールはあります。

http://www.vector.co.jp/soft/dl/win95/util/se205255.html


ご質問の内容が別のことでしたら、補足説明をお願いします。

id:taro707

ありがとうございます。

紹介してくださったツールはまだためしていませんが、補足をしておきます。

英文は映画の字幕を抜き出したもので

そのセリフの時間+英語のセリフ

と並んでいます(それを映画ごとにtxtファイルに保存しています)

英単語を入力したとき

どの映画で何時何分にどんなセリフか

というのを検索したいと思っています。

2008/01/11 14:33:09
id:TONTON3 No.4

TONTON3回答回数212ベストアンサー獲得回数42008/01/11 14:28:50

ポイント18pt

秀丸やサクラディタのGrepという機能でできます。

id:KairuaAruika No.5

KairuaAruika回答回数6926ベストアンサー獲得回数972008/01/11 14:32:01

ポイント18pt

サーチクロスというアプリで,検索対象のホルダ,検索対象の拡張子を指定すればOK。

除外項目等,詳細に設定を変えられます。

id:iwaamap No.6

iwaamap回答回数180ベストアンサー獲得回数102008/01/11 14:39:21

ポイント18pt

Windows付属のコマンドプロンプトなら

何もインストールせずにできます。


(1)コマンドプロンプトを起動

スタートメニュー

→プログラム

→アクセサリ

→コマンドプロンプト


(2)ディレクトリを移動

以下のコマンドを実行

---

cd "英文txtファイルがあるディレクトリ"

---


(3)

以下のコマンドを実行

---

find "検索対象文字列" hoge.txt

---

※hoge.txt は任意の映画のものを埋め込んでください


以下のようにするとtxtにも出力できます。

---

find "検索対象文字列" hoge.txt > kekka.txt

---

質問者が未読の回答一覧

 回答者回答受取ベストアンサー回答時間
1 nacbox 81 71 4 2008-01-11 16:18:52
2 ヨネちゃん 813 704 94 2008-01-11 17:52:58
3 fieldeleven 1 0 0 2008-01-12 16:51:25
  • id:airplant
    grepがお奨めです。

    【理由】
    1.語尾変化も含めて検索できる
    2.単語で検索できる。
    3.複数ファイルが対象(ディレクトリの階層が違っていてもできる)

    1.startを検索したいとして、start, startes, startedの3つがあります。これを1つずつやるのは手間で、grepなら一発でできます。
    2.例えばdoやIを含む場所を探したいときに、grep以外では途中にマッチしてしまい非常にややっこしいことになります。grepなら、先頭のDo、途中のdo、最後のdo.などを一発で検索できます。

    上記の1をやる例
    grep -Ei "\bstart(ed|s)?\b" *.txt

    上記の2をやる例
    grep -Ei "\bdo(es)?\b" *.txt

    ●2.の出力結果例
    mystery.txt:00:12:34 Do you know ?
    mystery.txt:00:56:34 I do not know.
    Comedy.txt:01:10:44 Does he ... ?
    Comedy.txt:01:12:34 He does.
    (Comedy.txt:01:12:56 "." is dot )→これは出ない

    ●手順
    Step1.ダウンロード(一般的なGNU grep)
    http://www.vector.co.jp/soft/win95/util/se015011.html

    Step2.Zipファイルを開いて、grep.exeをどこかへ入れる
       例えばテキストファイルがあるフォルダへ。

    Step3.No.6のかたが記載されているコマンドプロンプトを開く

    Step4.上の例に挙げたようなコマンドを動かすと結果が出る。

    Step5.結果が希望通りなら、コマンドの後ろに「> 結果ファイル名」のように書いて表示結果をファイルに落とす。
    くれぐれも、コマンドで指定したファイル名と同じ名前にならないように。
    例えば、「>結果.log」みたいにする。
    「*.txt」で出力を「>結果.txt」にすると、結果からも探してしまいループしてしまいます。

    なお、書き方は正規表現なので、googleなどで探せば鬼のように出てきますので、ご自分にあったサイトを一度見てみてください。
    難しいようでも、一度覚えれば鬼に金棒です。そんなに難しくありません。

この質問への反応(ブックマークコメント)

「あの人に答えてほしい」「この質問はあの人が答えられそう」というときに、回答リクエストを送ってみてましょう。

これ以上回答リクエストを送信することはできません。制限について

絞り込み :
はてなココの「ともだち」を表示します。
回答リクエストを送信したユーザーはいません