東京都/千代田区/千代田/1-1-1
東京都/中央区/日本橋/1-1-2
東京都/中野区/中央/1-1-3
東京都/渋谷区/神宮前/1-1-4
このようなテキストが並ぶファイルがあるとします。
これの「区」の箇所だけを自動的に抽出したいのです。
以上のテキストが、以下のようになるイメージです。
千代田区
中央区
中野区
渋谷区
「テキスト抽出ソフト」「正規表現」「GREP」というものを使えばできるのかもと考えております。
まず、
1.「東京都/」を消す
2.残ったテキストのうち、「/」の前までを残して後は消去
(ただし改行コードは残す)
これでできると思いますが、実際にどのソフトを使って、どういった正規表現を指定すればいいのかがわかりません。
どなたかよろしくお願い致します。
正規表現に対応したテキストエディタで
1.「東京都/」を「」に置換する(=消す)
2.「区/.*$」を「区」に置換する
という作業をすれば実現できるかと思います。