人力検索はてな
モバイル版を表示しています。PC版はこちら
i-mobile

テストのために、wget コマンドを使ってサイトをダウロードしたいのですが、
一部ページに、location ヘッダーを使って別ドメインに飛ばしている部分があります
このため、wget コマンドが、他サイトのデータを取りに行ってしまうのを抑制したいのですが、何か良い方法はないでしょうか?
wget 以外のツールでも良いのですが、とりあえず、ドメイン内のファイルをリンク切れなくすべてダウンロードできるかどうか確認できれば良いのですが
リファラーを操作できるのか、wget しか見つけられなかったのです

●質問者: rikimaru
●カテゴリ:ウェブ制作
✍キーワード:wget コマンド サイト ダウンロード テスト
○ 状態 :終了
└ 回答数 : 2/2件

▽最新の回答へ

1 ● kn1967
●35ポイント

(例1)対処ドメインが1つだけならばホストをまたがないようにする。

-H を使わない。

(例2)複数のドメインが対象の場合は、ドメインを指定する。

wget -r -D対象とするドメイン1,対象とするドメイン2,・・・,対象とするドメインn ダウンロード開始URL

(例3)飛ばしたくないドメインを特定できる場合は、そのドメインを指定する。

--exclude-domains=飛ばないドメイン1,飛ばないドメイン2,・・・,飛ばないドメインn

※その他のオプションは適宜追加してください。

【 wget 】 ファイルをダウンロードする - Linuxコマンド集:ITpro

◎質問者からの返答

おお・・・とても詳しい!!

早速、試してみます

ありがとうございました


2 ● pyopyopyo
●35ポイント ベストアンサー

wget のオプションに --max-redirect=1 を追加すれば、ご希望の動作になると思います。

http://www.gnu.org/software/wget/manual/wget.html

◎質問者からの返答

今回の要件だと、poyopoyo さんのオプションが簡単かもしれないです

こちらも、早速試してみたいと思います

ありがとうございました

関連質問


●質問をもっと探す●



0.人力検索はてなトップ
8.このページを友達に紹介
9.このページの先頭へ
対応機種一覧
お問い合わせ
ヘルプ/お知らせ
ログイン
無料ユーザー登録
はてなトップ