ウェブページ(URL指定/単一ページ)をローカル保存するツールを探しています

ただ、条件がありまして……

A:(URLなどを指定する)コマンドラインでページデータの取り込みを行える
・・この際、取り込み先フォルダ(名)を指定できればベター
B:自動でHTMLに対する書き換えを行い、imgタグの画像やCSSなどのパスを、オフライン状態でも閲覧可能なように書き換えてくれる(絶対URL指定ではオフライン時に読み込めないので)

この二条件を満たすツールをご存じでしたら教えていただけると助かります
BはFirefoxのScrapBookが賢いと思うのですが、コマンドラインから「特定URLの取り込み」を発動できないようなので……
ツール名と、コマンドラインオプションに関する解説ページのアドレス、という形で教えていただけると助かります

回答の条件
  • URL必須
  • 1人2回まで
  • 登録:2009/02/04 19:36:01
  • 終了:2009/02/05 14:42:53

ベストアンサー

id:Reiaru No.2

Reiaru回答回数152ベストアンサー獲得回数382009/02/04 22:02:35

ポイント80pt

こちらのソフトではどうでしょうか?

B要項の「取り込み先フォルダ(名)を指定できればベター」以外はクリアできていると思います。


WeBoX [ダウンロード]

http://webox.sakura.ne.jp/software/webox/download.html


起動オプションについて (コマンドライン起動)

http://help.webox.biz/index.php?%B5%AF%C6%B0%A5%AA%A5%D7%A5%B7%A...



コマンドライン起動例

"c:\Program Files\WeBox\WeBoX.exe" -u http://japanese.engadget.com/


書き換えられた HTML ソース

<link rel="stylesheet" href="../www.blogsmithmedia.com/japanese.engadget.com/media/theme.css" type="text/css" />

id:flatlight

ありがとうございます。WeBoXで可能だったのですね

・できれば、取り込むページごとに保存フォルダ(このフォルダのパスかフォルダ名を指定できるとベター)が生成されて欲しい(例えば同じブログ内の記事AとBを取り込む場合に、ページAフォルダ/ページBフォルダが別個に生成され、同じロゴ画像が両者に保存されるような動作。容量がムダですが、その分あとから不要なページをエクスプローラ上で消しやすい)

・できれば、バックグラウンドで動作し取り込み後に自動終了して欲しい

という我が儘はあるのですが、WeBoXで良いかなと思いました。ありがとうございました(&一応上記の二点を満たせるツールがないかどうか、もう少し質問開かせて下さい)

2009/02/05 00:33:36

その他の回答(2件)

id:hijk05 No.1

hijk05回答回数1307ベストアンサー獲得回数232009/02/04 20:19:33

id:flatlight

すみません、Bが搭載されていないような。例えば

http://japanese.engadget.com/

ですが、ScrapBookでの読み取り時にはHTML内のCSS読み込み部分が

link rel="stylesheet" type="text/css" href="index.css" media="all"

と直される(故にオフラインでもCSSが反映される)のですが、GetHTMLでは

link rel="stylesheet" href="http://www.blogsmithmedia.com/japanese.engadget.com/media/theme...." type="text/css"

のままです(故にオフラインではCSSが反映されなくなってしまう)

2009/02/04 21:36:25
id:Reiaru No.2

Reiaru回答回数152ベストアンサー獲得回数382009/02/04 22:02:35ここでベストアンサー

ポイント80pt

こちらのソフトではどうでしょうか?

B要項の「取り込み先フォルダ(名)を指定できればベター」以外はクリアできていると思います。


WeBoX [ダウンロード]

http://webox.sakura.ne.jp/software/webox/download.html


起動オプションについて (コマンドライン起動)

http://help.webox.biz/index.php?%B5%AF%C6%B0%A5%AA%A5%D7%A5%B7%A...



コマンドライン起動例

"c:\Program Files\WeBox\WeBoX.exe" -u http://japanese.engadget.com/


書き換えられた HTML ソース

<link rel="stylesheet" href="../www.blogsmithmedia.com/japanese.engadget.com/media/theme.css" type="text/css" />

id:flatlight

ありがとうございます。WeBoXで可能だったのですね

・できれば、取り込むページごとに保存フォルダ(このフォルダのパスかフォルダ名を指定できるとベター)が生成されて欲しい(例えば同じブログ内の記事AとBを取り込む場合に、ページAフォルダ/ページBフォルダが別個に生成され、同じロゴ画像が両者に保存されるような動作。容量がムダですが、その分あとから不要なページをエクスプローラ上で消しやすい)

・できれば、バックグラウンドで動作し取り込み後に自動終了して欲しい

という我が儘はあるのですが、WeBoXで良いかなと思いました。ありがとうございました(&一応上記の二点を満たせるツールがないかどうか、もう少し質問開かせて下さい)

2009/02/05 00:33:36
id:hong7 No.3

hong7回答回数157ベストアンサー獲得回数52009/02/04 23:05:38

wget http://www

id:flatlight

んー、wgetは、少なくともデフォルトではBのような機能がないですよね

コマンドラインオプションが豊富なツールだと言うことは理解しているので、僕が知らないだけで存在するかもしれないのですが・・・(もし可能でしたら解説ページを教えていただければ)

2009/02/05 00:22:52
  • id:qnighy
    wget -pk <URL>

    でリソース取得とリンクの相対化ができるようです。

    そのほか、-rで再帰的にページを取得、-mでミラーリング、-lで再帰取得の場合の深さ指定などができるようです。


この質問への反応(ブックマークコメント)

「あの人に答えてほしい」「この質問はあの人が答えられそう」というときに、回答リクエストを送ってみてましょう。

これ以上回答リクエストを送信することはできません。制限について

絞り込み :
はてなココの「ともだち」を表示します。
回答リクエストを送信したユーザーはいません