Web::ScraperでXPathを使って特定の要素を取り出し方はわかったのですが
たとえば
<br>
<br>
<b>大きく</b>
<br>
<br>
普通に
<br>
<br>
このようなIDやクラスを使われていない場合に「普通に」部分だけ取り出す指定の仕方はどうやるのでしょうか?
具体的な例があれば解説は不要です。
/html/body/text()[contains(.,"normal")]
http://jsfiddle.net/cherenkov/pFsME/1/
jsfiddleで動作確認するために/html/body/とかいていますが、適当に//text()から始めたほうが汎用的ですね。一応。
contains(str1, str2)
str1の.はコンテキストノード自身。
参考:「ツイート」を「ツイート(笑)」に置換するブックマークレット - IT戦記
追記:
コメントに書いたもの
https://gist.github.com/2314469
参考:よしいずの雑記帳 Web::Scraperを使ったPerlプログラムの例
/html/body/text()[contains(.,"normal")]
http://jsfiddle.net/cherenkov/pFsME/1/
jsfiddleで動作確認するために/html/body/とかいていますが、適当に//text()から始めたほうが汎用的ですね。一応。
contains(str1, str2)
str1の.はコンテキストノード自身。
参考:「ツイート」を「ツイート(笑)」に置換するブックマークレット - IT戦記
追記:
コメントに書いたもの
https://gist.github.com/2314469
参考:よしいずの雑記帳 Web::Scraperを使ったPerlプログラムの例
こちらがサンプルになりますhttps://gist.github.com/84958dbb49ecb3c9ebb9
//td/text()[not(normalize-space(.)="")]
で出来ましたありがとうございました
こちらがサンプルになりますhttps://gist.github.com/84958dbb49ecb3c9ebb9
2012/04/06 07:38:31//td/text()[not(normalize-space(.)="")]
で出来ましたありがとうございました