<xyz>xyz</zyz>というタグがあるテキストの中に数十個あるとします。それを抽出して
<xyz>xyz</zyz>
<xyz>xyz</zyz>
<xyz>xyz</zyz>
などと改行をいれて、その部分だけ取り出したいと思っています。正規表現か何かで取得できると思うのですが、いまいちわかりません。よければ参考になる正規表現のページも合わせて教えてください。
Ruby の例:
Tagname = "xyz"
text = open("test.txt"){|f| f.read }
tags = text.scan(/(<#{Tagname}>.*?</#{Tagname}>/m)
puts tags
以下を参考にあげておきます:
置換機能を使って
<.*>\f.*\f</.*>
を
\1
に置換すれば良いと思います。
この方法ではネストされたタグには対応しません。
秀丸のマクロがありました
http://www18.big.or.jp/~fujiwara/ikki/hidemaru/macro/deletet...
Ruby の例:
Tagname = "xyz"
text = open("test.txt"){|f| f.read }
tags = text.scan(/(<#{Tagname}>.*?</#{Tagname}>/m)
puts tags
以下を参考にあげておきます:
完璧です。ありがとうございます。
完璧です。ありがとうございます。
完璧です。ありがとうございます。