人力検索はてな
モバイル版を表示しています。PC版はこちら
i-mobile

plaggerをインストールしたんですが、EntryFullTextのフィルタファイルのextractの設定がよく分かりません。正規表現を使っているのは分かるのですが。

exactをどのように書くと、どのような箇所に適用されるのか?
具体的に教えて下さい。

●質問者: rdera
●カテゴリ:コンピュータ インターネット
✍キーワード:Plagger インストール ファイル フィルタ 正規表現
○ 状態 :終了
└ 回答数 : 1/1件

▽最新の回答へ

1 ● こうじ
●60ポイント

例1

例えば

extract: <div class="storycontent">(.*?)<div class="feedback">

と書くと、

<div class="storycontent">

から、次の

<div class="feedback">

までの文字列を抽出します。

例2

extract: <h3 class="date">(.*?)</h3>.*?<h2 class="title">(.*?)</h2>(.*?)<br clear="all" />

この場合、 <h3 class="date">…</h3>の中身と、その次に出てくる<h2 class="title">…</h2>の中身、そして</h2>から
までの文字列を抽出します。


「.」が「任意の文字」を、「*?」が「直前の正規表現と0回以上一致(最短一致)」なので「foo.*?bar」と書くと、fooとbarの間にあるものが抽出される…という感じです。


あまり参考になりませんが以下に例がいくつかあります。

◎質問者からの返答

ご丁寧に回答して頂きありがとうございます。

1つ質問があります。

抽出されるのは指定された範囲のhtmlなんでしょうか?

コメント欄から回答して頂くと助かります。

宜しくお願いします。

関連質問


●質問をもっと探す●



0.人力検索はてなトップ
8.このページを友達に紹介
9.このページの先頭へ
対応機種一覧
お問い合わせ
ヘルプ/お知らせ
ログイン
無料ユーザー登録
はてなトップ