plaggerをインストールしたんですが、EntryFullTextのフィルタファイルのextractの設定がよく分かりません。正規表現を使っているのは分かるのですが。


exactをどのように書くと、どのような箇所に適用されるのか?
具体的に教えて下さい。

回答の条件
  • 1人1回まで
  • 登録:2007/07/15 18:48:07
  • 終了:2007/07/22 18:50:03

回答(1件)

id:acqua_alta No.1

こうじ回答回数8ベストアンサー獲得回数02007/07/15 21:16:52

ポイント60pt

例1

例えば

extract: <div class="storycontent">(.*?)<div class="feedback">

と書くと、

<div class="storycontent">

から、次の

<div class="feedback">

までの文字列を抽出します。

例2

extract: <h3 class="date">(.*?)</h3>.*?<h2 class="title">(.*?)</h2>(.*?)<br clear="all" />

この場合、 <h3 class="date">…</h3>の中身と、その次に出てくる<h2 class="title">…</h2>の中身、そして</h2>から
までの文字列を抽出します。


「.」が「任意の文字」を、「*?」が「直前の正規表現と0回以上一致(最短一致)」なので「foo.*?bar」と書くと、fooとbarの間にあるものが抽出される…という感じです。


あまり参考になりませんが以下に例がいくつかあります。

id:rdera

ご丁寧に回答して頂きありがとうございます。

1つ質問があります。

抽出されるのは指定された範囲のhtmlなんでしょうか?

コメント欄から回答して頂くと助かります。

宜しくお願いします。

2007/07/15 22:12:37
  • id:acqua_alta
    >抽出されるのは指定された範囲のhtmlなんでしょうか?
    htmlも含めて、指定範囲のテキストが抽出されます。

この質問への反応(ブックマークコメント)

「あの人に答えてほしい」「この質問はあの人が答えられそう」というときに、回答リクエストを送ってみてましょう。

これ以上回答リクエストを送信することはできません。制限について

絞り込み :
はてなココの「ともだち」を表示します。
回答リクエストを送信したユーザーはいません