人力検索はてな
モバイル版を表示しています。PC版はこちら
i-mobile

WEBサーバー上にあるリンクされていないhtmlのファイルを見つけ出すいい方法があれば教えてください。

リンクされていないhtmlのファイルを見つけては削除しようと試みていますが
ファイルとディレクトリが多いため、ひとつひとつ見て回ることに限界を感じました。
リンクされていないURLがわかる、リンクされているファイルだけわかるなど
何か楽に見つけ出すいい方法はありますでしょうか。

●質問者: inumazin
●カテゴリ:インターネット ウェブ制作
✍キーワード:HTML URL Web ひとつ サーバー
○ 状態 :終了
└ 回答数 : 4/4件

▽最新の回答へ

1 ● KairuaAruika
●23ポイント

http://www.vector.co.jp/soft/win95/net/se143662.html

http://deadlink.tv/

http://soft.tsukae.net/softdir/cutlinkcheker.html

http://linkchecker.jp/

http://www.rd.mmtr.or.jp/~tkhs/free/f02_05.htm

◎質問者からの返答

わかりづらい質問ですいません。

リンク切れを探すのではなくて、

リンクされていないファイルがわかる方法

を求めています。

最後のやつが近いものでした。ありがとうございました。


2 ● rev-9
●23ポイント

まず前提として、ご希望の「WEBサーバー上にあるリンクされていないhtmlのファイルを見つけ出す」ことは一筋縄ではいきません。HTTPのプロトコル上、サーバー側に存在するファイルのすべてを確実にリストアップする方法が存在しないからです。もちろん実際にはディレクトリインデックスが有効になっていれば実用上は何とかなるとは思いますが、一方でセキュリティ的にはどうしても必要でない限り無効にしておきたいものでもあります。

そこで、当然こういうことをやりたいということは自分の管理下にあるWebサーバーでしょうから、何とかしてローカルのファイルシステムとしてマウントするか、あるいはミラーをローカルに構築し、そちらを検索するソフトを紹介します。

http://hp.vector.co.jp/authors/VA014575/chicchi/kotou/readme.htm...

実は↑の回答の5番目のページでも紹介されているソフトですが、リンク切れだけではなく、「サイトのトップからリンクを辿っても行き着けないファイル」を見つけ出す機能がメインです。

◎質問者からの返答

ありがとうございます。求めていたものにとても近いです。

これを利用してみます。


3 ● ffmpeg
●22ポイント

あなた自身のサイトにクローラーを走らせます。そうすれば、リンクされているURLがすべてわかります。それにないファイルを削除します。

UNIXがわかれば、これらを自動で行うスクリプトは3行で書けます。

http://www

◎質問者からの返答

なかなかハードルが高そうです…。


4 ● はとね
●22ポイント

wget+diffをオススメします。

[windowsでwgetを使う方法]

http://weather.is.kochi-u.ac.jp/winwget.html

使い方はここを参照してください。

[wgetの使い方]

http://tech.bayashi.net/svr/doc/wget.html

↓サンプル↓([wgetの使い方]のページより引用)

# wget -l 3 http://www.sample.com/index.htm

リンク先をたどって、3階層分のファイルを取得してくれます。

これで、リンクしているデータだけを保存することが出来ます。

◎質問者からの返答

なるほど、こういう方法もあるんですね。

関連質問


●質問をもっと探す●



0.人力検索はてなトップ
8.このページを友達に紹介
9.このページの先頭へ
対応機種一覧
お問い合わせ
ヘルプ/お知らせ
ログイン
無料ユーザー登録
はてなトップ