$text = [[自転車]]に乗った[[男]]がいる

Question

tokyosmash

115

114もっと見る

70pt

インターネットウェブ制作

$text = [[自転車]]に乗った[[男]]がいる

$textから [[ ]] に囲まれた単語だけを抽出する正規表現は
preg_match_all('/\[\[(.*?)\]\]/',$text, $matches)
と書けました。

それでは
$text = [[自転車|バイク]]に乗った[[男]]がいる
から [[ ]] に囲まれていて、なおかつ | が入っている単語を抽出するのはどうすればいいでしょうか
上記の例なら、　自転車|バイク　と抽出したいのです。

preg_match_all('/\[\[(.*?\|.*?)\]\]/',$text, $matches)
と書いてみましたが、条件によっては変な抽出の仕方をしてしまいます。

よろしくお願いいたします。

回答の条件

1人5回まで

登録：2007/12/06 21:09:43
終了：2007/12/13 21:10:10

※ 有料アンケート・ポイント付き質問機能は2023年2月28日に終了しました。

tezcello 2007/12/07 01:07:56

> 変な抽出
具体的には、どんな事になってしまうのでしょうか？
質問文の例ではうまくいきますよね？
tokyosmash 2007/12/07 01:49:40

コメントありがとうございます。
例えばこちらの文章だと抽出がうまくいきません。

　Internet Protocolとは[[インターネット]]において情報の伝達を行う[[通信プロトコル|プロトコル]]であり、インターネットの基礎部分となる重要な役割を持つ。

この場合だと以下が抽出されます。

　インターネット]]において情報の伝達を行う[[通信プロトコル|プロトコル

[[インターネット]]の部分に正規表現が反応してしまっているようです。

「あの人に答えてほしい」「この質問はあの人が答えられそう」というときに、回答リクエストを送ってみてましょう。

これ以上回答リクエストを送信することはできません。制限について

リクエスト送信済

回答リクエストを送信したユーザーはいません

showyou · Answer 1 · 2007-12-07T02:11:30+09:00

具体的な回答がすぐには書けないですが、

要は

・|の前に]]が来ない

・|の後ろに[[が来ない

ことを条件をすれば良いのでは？

Mook · Answer 2 · 2007-12-07T02:17:17+09:00

うまくいかないケースというのは、[[××]] が　[[×××|×××]]の前にあるケースでしょうか。

であれば、

preg_match_all('/\[\[([^\[]*?\|.*?)\]\]/',$text, $matches);

といった感じで回避できるかと思います。

$text = [[自転車]]に乗った[[男]]がいる

回答（2件）

showyou96102007/12/07 02:11:30

Mook13143932007/12/07 02:17:17

コメント（2件)

この質問への反応（ブックマークコメント）