人力検索はてな
モバイル版を表示しています。PC版はこちら
i-mobile

指定したブログの新着記事を読み込み、リンクされている画像だけを自動で保存するツールなどないでしょうか。出来れば、その保存先ディレクトリはそのブログの記事のタイトルであると便利です。

Windows / Mac / UNIX何でもいいですが、Perlのスクリプトとかだとありがたいです。

●質問者: naochin
●カテゴリ:コンピュータ インターネット
○ 状態 :終了
└ 回答数 : 2/2件

▽最新の回答へ

1 ● TransFreeBSD
ベストアンサー

まずブログの新着確認だと、やっぱりRSSかなと思ってググると、ちょうどそれらしいのありました。
RSSはXML::Feedで処理して、以前との重複分を除いて(それをDeduperと言うらしい)新着分を取得してます。
http://d.hatena.ne.jp/tokuhirom/20090407/1239079453
XML::Feed自体は次のエントリ。
http://d.hatena.ne.jp/ramtiga/20110711/p1

で、そこから画像取得というと、定番はWeb::Scraperかと思います。
http://d.hatena.ne.jp/inouetakuya/20100324/1269450251
あと、jQuery風なWeb::Queryというのがある様です。
http://perl-users.jp/articles/advent-calendar/2011/casual/22

まとめると、XML::Feed::Deduperで新着エントリのタイトルとURLを取得して、Web::Queryで画像URLを取得してLWP::UserAgentで画像自体を取得、という流れでしょうか。


2 ● hiromaca

これは便利です。

https://addons.mozilla.org/ja/firefox/addon/downthemall/


naochinさんのコメント
手動でやる場合は、DownThemAllは非常に有用なツールだと思います。 実際、今利用しているのはDownThemAllです。 しかし、「新着記事を」「自動で」「ページのタイトルをディレクトリ名に」などの条件を満たしません。

hiromacaさんのコメント
Perlでしたら、、、 http://yusukebe.com/ が参考になるかと。
関連質問

●質問をもっと探す●



0.人力検索はてなトップ
8.このページを友達に紹介
9.このページの先頭へ
対応機種一覧
お問い合わせ
ヘルプ/お知らせ
ログイン
無料ユーザー登録
はてなトップ