①rubyで<img>タグのsrc部分(画像のURLだけを)を抜き取りたいです。
②<dd>タグ内の内容を取得したいです。
例)
【入力】
<div class="mceTemp" style="text-align: left;"><dl class="wp-caption alignleft caption-alignleft" style="width: 262px;"> <dt class="wp-caption-dt"><img class="size-full wp-image-5" src="http://online.wsj.com/media/yen_D_20111028085225.jpg" alt="" width="262" height="174" /></dt> <dd class="wp-caption-dd wp-cite-dd" style="text-align: right;">Bloomberg News</dd> </dl></div>「日本株式会社」のスキャンダルが後を絶たない。
【期待する内容】
①http://online.wsj.com/media/yen_D_20111028085225.jpg
②Bloomberg News
こんな感じ?
str = '<div class="mceTemp" style="text-align: left;"><dl class="wp-caption alignleft caption-alignleft" style="width: 262px;"> <dt class="wp-caption-dt"><img class="size-full wp-image-5" src="http://online.wsj.com/media/yen_D_20111028085225.jpg" alt="" width="262" height="174" /></dt> <dd class="wp-caption-dd wp-cite-dd" style="text-align: right;">Bloomberg News</dd> </dl></div>「日本株式会社」のスキャンダルが後を絶たない。' if str =~ /<img[^>]*src="([^"]+)"/ then puts $1 end if str =~ /<dd[^>]*>([^>]+)<\/dd>/ then puts $1 end
ありがとうございます。すぐ確認します。
2011/10/31 22:35:20確認しました。完璧です。
2011/10/31 22:40:33