pmoeko回答ポイント 1000ptウォッチ 1

PHP・正規表現でいくつかのフォーマットから住所を抜き出したく、そのコードを教えてください。

ーーー
<パターンA>
■住所
東京都渋谷区渋谷1-1-1

<パターンB>
住所:東京都渋谷区渋谷1-1-1

<パターンC>
<td style="width: 20%; height: 22px;">住所</td>
<td style="width: 80%; height: 22px;">東京都渋谷区渋谷1-1-1</td>
ーーー
※住所が「所在地」「場所」の場合もある。

途中まで考えてみたのは以下のとおりです。

$post_code= "【該当のページのソースコード】"
$contents = strip_tags($post_code);//タグ除去
$contents = preg_replace('/所在地(\n|\r|\r\n)/', '所在地', $contents);//住所と所在地で見出しのあとに改行がある場合は削除
$contents = preg_replace('/住所(\n|\r|\r\n)/', '住所', $contents);

preg_match('/(住所|所在地)(.+)\n/', $contents, $match);//住所と所在地がある行の住所部分を抜き出す
$text = $match[2];
$text = str_replace(':', '', $text);//住所に「:」とかあれば除く
$text = str_replace(':', '', $text);
$text = str_replace(' ', '', $text);
$text = str_replace(' ', '', $text);

URLは不要ですのでご教示いただけましたら幸いです。

※ 有料アンケート・ポイント付き質問機能は2023年2月28日に終了しました。
ログインして回答する

ベストアンサー

その他の回答

この質問へのコメント

コメントはありません

この質問への反応(ブックマークコメント)

質問の情報

登録日時
2020-02-23 15:39:03
終了日時
2020-02-26 14:23:12
回答条件
1人1回まで

この質問のカテゴリ

この質問に含まれるキーワード

PHP7798URL11376?B181

人気の質問

メニュー

PC版