指定したﾌﾞﾛｸﾞの新着記事を読み込み､ﾘﾝｸされている画像だけを自動で保存するﾂｰﾙなどないでしょうか｡出来れば､その保存先ﾃﾞｨﾚｸﾄﾘはそのﾌﾞﾛｸﾞの記事のﾀｲﾄ…

人力検索はてな

ﾓﾊﾞｲﾙ版を表示しています｡PC版はこちら

指定したﾌﾞﾛｸﾞの新着記事を読み込み､ﾘﾝｸされている画像だけを自動で保存するﾂｰﾙなどないでしょうか｡出来れば､その保存先ﾃﾞｨﾚｸﾄﾘはそのﾌﾞﾛｸﾞの記事のﾀｲﾄﾙであると便利です｡

Windows / Mac / UNIX何でもいいですが､Perlのｽｸﾘﾌﾟﾄとかだとありがたいです｡

●質問者: naochin
●ｶﾃｺﾞﾘ:ｺﾝﾋﾟｭｰﾀｲﾝﾀｰﾈｯﾄ
○ 状態 :終了
└ 回答数 : 2/2件

▽最新の回答へ

▽1 ● TransFreeBSD

ﾍﾞｽﾄｱﾝｻｰ

まずﾌﾞﾛｸﾞの新着確認だと､やっぱりRSSかなと思ってｸﾞｸﾞると､ちょうどそれらしいのありました｡
RSSはXML::Feedで処理して､以前との重複分を除いて(それをDeduperと言うらしい)新着分を取得してます｡
http://d.hatena.ne.jp/tokuhirom/20090407/1239079453
XML::Feed自体は次のｴﾝﾄﾘ｡
http://d.hatena.ne.jp/ramtiga/20110711/p1

で､そこから画像取得というと､定番はWeb::Scraperかと思います｡
http://d.hatena.ne.jp/inouetakuya/20100324/1269450251
あと､jQuery風なWeb::Queryというのがある様です｡
http://perl-users.jp/articles/advent-calendar/2011/casual/22

まとめると､XML::Feed::Deduperで新着ｴﾝﾄﾘのﾀｲﾄﾙとURLを取得して､Web::Queryで画像URLを取得してLWP::UserAgentで画像自体を取得､という流れでしょうか｡

▽2 ● hiromaca

これは便利です｡

https://addons.mozilla.org/ja/firefox/addon/downthemall/

naochinさんのｺﾒﾝﾄ
手動でやる場合は､DownThemAllは非常に有用なﾂｰﾙだと思います｡実際､今利用しているのはDownThemAllです｡しかし､｢新着記事を｣｢自動で｣｢ﾍﾟｰｼﾞのﾀｲﾄﾙをﾃﾞｨﾚｸﾄﾘ名に｣などの条件を満たしません｡

hiromacaさんのｺﾒﾝﾄ
Perlでしたら､､､ http://yusukebe.com/ が参考になるかと｡