英語対訳テキストの文章の中で、半角の英語の部分だけを取り出したいのですが、いい方法はないでしょうか。

日本語以外の部分には半角は一切使われていないという前提で(これは修正します)、半角の改行文字を含んだものだけを一気に抽出する方法はありませんか。

回答の条件
  • URL必須
  • 1人2回まで
  • 登録:2007/12/14 02:47:17
  • 終了:2007/12/15 02:02:47

回答(4件)

id:Gay_Yahng No.1

Gay_Yahng回答回数724ベストアンサー獲得回数262007/12/14 11:37:17

ポイント23pt

>日本語以外の部分には半角は一切使われていないという前提

つまり、

「このサイトはhatena」

はすべて全角ということですか?

>半角の改行文字

とはどんなものなのでしょう?半角と改行文字でしょうか?

 

どのようなテキストなのか、いまひとつやりたいことがわからないのですが、具体的な文例を挙げられませんか?

 

http://www.vector.co.jp/soft/win95/util/se324777.html

こんなのありました。意図と合わないようならごめんなさい。

id:clinejp

すみません、確かに文章ヘンですね。

具体例を挙げます。

1あなたのお名前は何ですか

My name is Shiro.

という対訳が載っているテキストの、英語部分だけ、しかも、ずらーっとつながらずに、改行を含んで抽出したい

ということです。

加えて、できれば、その部分はすべて別テキストに切り取ってしまい、結果的に日本語と、英語の文章がそれぞれ別テキストになるということができるといいです。

なんとかなるでしょうか?

2007/12/14 17:34:54
id:Gay_Yahng No.2

Gay_Yahng回答回数724ベストアンサー獲得回数262007/12/14 18:05:11

ポイント23pt

2回目です。

ちょっとスマートじゃないやり方ですが、エクセルはお持ちでしょうか?

A列に1から順に必要な行数分数字を入れる(A1=1,A2=2、、、、、)

b列に全角、半角が混じったテキストをコピー

こんな感じ。

A列 B列

1 私はトム

2 I am Tom.

3 本

4 book

5 動物園

6 ZOO

7 りんご

8 apple

 

これをB列で並べ替え

8 apple

4 book

2 I am Tom.

6 ZOO

7 りんご

1 私はトム

5 動物園

3 本

 

次に日本語部分だけをA列で並べ替え

1 私はトム

3 本

5 動物園

7 りんご

同様に英語部分だけをA列で並べ替え

2 I am Tom.

4 book

6 ZOO

8 apple

 

http://q.hatena.ne.jp/1197568033

id:magis No.3

magis回答回数11ベストアンサー獲得回数12007/12/14 21:38:18

ポイント22pt

現在どのようなテキストエディタをお使いでしょうか?正規表現による置き換えが可能ならば,

^[^a-zA-Z0-1].*\n

のように半角の文字で始まらない行を検索し,マッチしたなら,からっぽのなにもないものに置き換えることで半角の行のみ抽出出来ると思います。

http://q.hatena.ne.jp/1197568033

id:clinejp

秀丸を使っていますが、やりかたがわかりません。

教えていただけると助かります。

確か秀丸も正規表現のマクロみたいなのはあったと思いますが、やったことがありません。

2007/12/14 22:13:33
id:magis No.4

magis回答回数11ベストアンサー獲得回数12007/12/14 23:09:37

ポイント22pt

再び回答欄で失礼します。

秀丸でテキストファイルを開いて、メニューの置換を選択し、

正規表現にチェック。

検索に

^[^a-zA-Z0-1].*\n

置換を空欄にして、全置換を実行でどうでしょうか?

http://pc.dearie.jp/hidemaru/replace/index.html

コメントはまだありません

この質問への反応(ブックマークコメント)

「あの人に答えてほしい」「この質問はあの人が答えられそう」というときに、回答リクエストを送ってみてましょう。

これ以上回答リクエストを送信することはできません。制限について

絞り込み :
はてなココの「ともだち」を表示します。
回答リクエストを送信したユーザーはいません