下記からphpの正規表現で文字だけ抜き出す方法を教えて下さい。文字列は<>?などエスケープされるもの以外は何でも入ります。

Question

dosukoi1988

11

11もっと見る

80pt

インターネットウェブ制作

下記からphpの正規表現で文字だけ抜き出す方法を教えて下さい。文字列は<>?などエスケープされるもの以外は何でも入ります。

<tr><td><a href="index.htm">top</a> <a href="test.htm">test</a> japan</td></tr>
<tr><td>フランス</td></tr>
<tr><td><a href="index.htm">top</a> <a href="test.htm">test</a> =,+){(<>&</td></tr>

・期待すべき結果
japan
フランス
=,+){(<>&

<td>かで囲まれているところがキーだと思い下記のようにしましたがうまくいきません。
preg_match_all("/(<td>|<\/span>)(.+?)<\/td><\/tr>+/", $VAL, $TEXT);

解決策ご提示の方には高ポイント差し上げます。

回答の条件

1人2回まで

登録：2007/05/14 01:11:14
終了：2007/05/21 01:15:02

※ 有料アンケート・ポイント付き質問機能は2023年2月28日に終了しました。

コメントはまだありません

yuzuchikinのひとり上手な日記(仮) - 今日が誕生日の声優さんをつぶやくTwitterBot(Seiyu_Birthday)を作った 2009-09-26 01:29:27

今日が誕生日の声優さんをつぶやくTwitterBot(Seiyu_Birthday)を作った　今日が誕生日の声優さんをつぶやくTwitterBotを作ってみました。　コチラ→今日が誕生日の声優さんをつぶやく君(Seiyu_Birth

「あの人に答えてほしい」「この質問はあの人が答えられそう」というときに、回答リクエストを送ってみてましょう。

これ以上回答リクエストを送信することはできません。制限について

リクエスト送信済

回答リクエストを送信したユーザーはいません

GEN111 · Answer 1 · 2007-05-14T07:41:20+09:00

$html = '<tr><td><span id="test"><a href="index.htm">top</a>&nbsp;<a href="test.htm">test</a>&nbsp;</span>japan</td></tr>
<tr><td>フランス</td></tr>
<tr><td><span id="test"><a href="index.htm">top</a>&nbsp;<a href="test.htm">test</a>&nbsp;</span>=,+){(&lt;&gt;&amp;</td></tr>
';

preg_match_all('{<tr>.*>(.+?)</td></tr>}', $html, $matches) ;
print_r($matches[1]) ;

こんな感じでどうでしょうか。

gekikawa · Answer 2 · 2007-05-14T10:07:25+09:00

>正規表現で文字だけ抜き出す方法

配列として（タグ以外の）文字を抜き出すのなら、提示された文章を$VALとして、

preg_match_all('/＞(.+?)＜/', $VAL, $matches);

またはタグの除去ならばstrip_tags()というのも便利です。

期待すべき結果のところで、top、test、＆nbsp;がないのは＜a＞タグかあるとか、スペースだからでしょうか？

もしくはおっしゃるように＜td＞～＜/td＞または＜/span＞～＜/td＞のパターンだけとりたいのでしょうか？この場合は

preg_match_all('@(＜td＞|＜/span＞)([^＜＞]+?)＜/td＞@', $VAL, $matches);

でよいと思います。

このあたりのルールを明示して頂くとより回答しやすくなると思います。

<>（半角）が入ると表示が変になってしまうので、全角で書いてあります。

Yota · Answer 3 · 2007-05-14T15:19:04+09:00

$subject = '文字列';

$pattern='/>([^<>]+)</';

;$matches=array();

preg_match_all($pattern,$subject,$matches);

print_r($matches[1]);

nbspもいらないのでしたらさらに、

$matches_ = array();

foreach($matches[1] as $value ) {

if ($value != 'nbsp') $matches_[] .= $value ;

}

print_r($matches_);

下記からphpの正規表現で文字だけ抜き出す方法を教えて下さい。文字列は<>?などエスケープされるもの以外は何でも入ります。

回答（3件）

GEN111472582007/05/14 07:41:20

gekikawa110112007/05/14 10:07:25

Yota453282007/05/14 15:19:04

コメント（0件)

この質問への反応（ブックマークコメント）

トラックバック