人力検索はてな
モバイル版を表示しています。PC版はこちら
i-mobile

英語対訳テキストの文章の中で、半角の英語の部分だけを取り出したいのですが、いい方法はないでしょうか。
日本語以外の部分には半角は一切使われていないという前提で(これは修正します)、半角の改行文字を含んだものだけを一気に抽出する方法はありませんか。


●質問者: clinejp
●カテゴリ:コンピュータ ウェブ制作
✍キーワード:テキスト 抽出 日本語 英語
○ 状態 :終了
└ 回答数 : 4/4件

▽最新の回答へ

1 ● Gay_Yahng
●23ポイント

>日本語以外の部分には半角は一切使われていないという前提

つまり、

「このサイトはhatena」

はすべて全角ということですか?

>半角の改行文字

とはどんなものなのでしょう?半角と改行文字でしょうか?

どのようなテキストなのか、いまひとつやりたいことがわからないのですが、具体的な文例を挙げられませんか?

http://www.vector.co.jp/soft/win95/util/se324777.html

こんなのありました。意図と合わないようならごめんなさい。

◎質問者からの返答

すみません、確かに文章ヘンですね。

具体例を挙げます。

1あなたのお名前は何ですか

My name is Shiro.

という対訳が載っているテキストの、英語部分だけ、しかも、ずらーっとつながらずに、改行を含んで抽出したい

ということです。

加えて、できれば、その部分はすべて別テキストに切り取ってしまい、結果的に日本語と、英語の文章がそれぞれ別テキストになるということができるといいです。

なんとかなるでしょうか?


2 ● Gay_Yahng
●23ポイント

2回目です。

ちょっとスマートじゃないやり方ですが、エクセルはお持ちでしょうか?

A列に1から順に必要な行数分数字を入れる(A1=1,A2=2、、、、、)

b列に全角、半角が混じったテキストをコピー

こんな感じ。

A列B列

1私はトム

2I am Tom.

3本

4book

5動物園

6ZOO

7りんご

8apple

これをB列で並べ替え

8apple

4book

2I am Tom.

6ZOO

7りんご

1私はトム

5動物園

3本

次に日本語部分だけをA列で並べ替え

1私はトム

3本

5動物園

7りんご

同様に英語部分だけをA列で並べ替え

2I am Tom.

4book

6ZOO

8apple

http://q.hatena.ne.jp/1197568033


3 ● magis
●22ポイント

現在どのようなテキストエディタをお使いでしょうか?正規表現による置き換えが可能ならば,

^[^a-zA-Z0-1].*\n

のように半角の文字で始まらない行を検索し,マッチしたなら,からっぽのなにもないものに置き換えることで半角の行のみ抽出出来ると思います。

http://q.hatena.ne.jp/1197568033

◎質問者からの返答

秀丸を使っていますが、やりかたがわかりません。

教えていただけると助かります。

確か秀丸も正規表現のマクロみたいなのはあったと思いますが、やったことがありません。


4 ● magis
●22ポイント

再び回答欄で失礼します。

秀丸でテキストファイルを開いて、メニューの置換を選択し、

正規表現にチェック。

検索に

^[^a-zA-Z0-1].*\n

置換を空欄にして、全置換を実行でどうでしょうか?

http://pc.dearie.jp/hidemaru/replace/index.html

関連質問


●質問をもっと探す●



0.人力検索はてなトップ
8.このページを友達に紹介
9.このページの先頭へ
対応機種一覧
お問い合わせ
ヘルプ/お知らせ
ログイン
無料ユーザー登録
はてなトップ