Windows / Mac / UNIX何でもいいですが、Perlのスクリプトとかだとありがたいです。
まずブログの新着確認だと、やっぱりRSSかなと思ってググると、ちょうどそれらしいのありました。
RSSはXML::Feedで処理して、以前との重複分を除いて(それをDeduperと言うらしい)新着分を取得してます。
http://d.hatena.ne.jp/tokuhirom/20090407/1239079453
XML::Feed自体は次のエントリ。
http://d.hatena.ne.jp/ramtiga/20110711/p1
で、そこから画像取得というと、定番はWeb::Scraperかと思います。
http://d.hatena.ne.jp/inouetakuya/20100324/1269450251
あと、jQuery風なWeb::Queryというのがある様です。
http://perl-users.jp/articles/advent-calendar/2011/casual/22
まとめると、XML::Feed::Deduperで新着エントリのタイトルとURLを取得して、Web::Queryで画像URLを取得してLWP::UserAgentで画像自体を取得、という流れでしょうか。
まずブログの新着確認だと、やっぱりRSSかなと思ってググると、ちょうどそれらしいのありました。
RSSはXML::Feedで処理して、以前との重複分を除いて(それをDeduperと言うらしい)新着分を取得してます。
http://d.hatena.ne.jp/tokuhirom/20090407/1239079453
XML::Feed自体は次のエントリ。
http://d.hatena.ne.jp/ramtiga/20110711/p1
で、そこから画像取得というと、定番はWeb::Scraperかと思います。
http://d.hatena.ne.jp/inouetakuya/20100324/1269450251
あと、jQuery風なWeb::Queryというのがある様です。
http://perl-users.jp/articles/advent-calendar/2011/casual/22
まとめると、XML::Feed::Deduperで新着エントリのタイトルとURLを取得して、Web::Queryで画像URLを取得してLWP::UserAgentで画像自体を取得、という流れでしょうか。
手動でやる場合は、DownThemAllは非常に有用なツールだと思います。
2012/01/03 06:18:10実際、今利用しているのはDownThemAllです。
しかし、「新着記事を」「自動で」「ページのタイトルをディレクトリ名に」などの条件を満たしません。
Perlでしたら、、、
2012/01/03 07:55:14http://yusukebe.com/
が参考になるかと。