人力検索はてな
モバイル版を表示しています。PC版はこちら
i-mobile

HTMLファイルや画像ファイルが入っているフォルダのなかで、どこからもリンクがはられていないファイルを一括して削除する方法はありますか。

●質問者: oz8
●カテゴリ:インターネット
✍キーワード:ファイル フォルダ リンク 画像 TM
○ 状態 :終了
└ 回答数 : 4/4件

▽最新の回答へ

1 ● takano32
●23ポイント

サイトの規模が小さいなら、一度

wget -r http://example.com/

のように再帰的にダウンロードしてしまい、元ディレクトリとダウンロードしたディレクトリを差し替えるという方法はどうでしょうか。

◎質問者からの返答

回答ありがとうございます。

エックスサーバーというレンタルサーバーを使っていまして

あれってシェルが使えなったと思います。

再帰的にダウンロード?

の部分がよくわかりません。

よろしくおねがいします。


2 ● pahoo
●23ポイント

「どこからもリンクがはられていないファイル」というのは、他サイトからハイパーリンクが張られていないファイルという意味ですか?


当該ファイルにハイパーリンクが張られているかどうかを直接判断する手立てはありません。

代替策として、Webサーバのログを解析し、当該ファイルにアクセスしてきた Referer があれば、それはハイパーリンクされているという仮説を立てます。

たとえば Apache であれば、Refererログを解析することになります。

◎質問者からの返答

もっとシステマティックで簡単な方法ないでしょうか。

2万ファイルなので、とてもそんな時間はないです。


3 ● matsuoki
●22ポイント

ID:takano32 さんとおなじ方法ですが、手元にあるPCに wget -r http://example.com/ のように再帰的にダウンロードした時に、ダウンロードされなかったファイルが独立ファイルです。

wgetが使えなくても、いわゆるirvineやiriaのようなダウンローダーで再帰的にダウンロードすれば良いです。

再帰的にダウンロード、というのは、あるファイルからリンクしているファイルをダウンロードし、そのファイルからさらにリンクしているファイルをダウンロードし・・・というのを際限なく繰り返すことです。

なので、

  1. wget -r http://example.com/ でコンテンツを再帰的にダウンロードする
  2. 元々あったコンテンツを削除またはリネームする
  3. wgetでダウンロードしたコンテンツをアップロードする

で、単独ファイルを排除出来ます。



注意点

ちなみにAdobeのDreamweaverというウェブ開発ツールでは、「単独ファイルの検出」と言う機能があり、他のファイルからリンクされていないファイルを検出出来ます。

◎質問者からの返答

「Dreamweaverというウェブ開発ツールでは、「単独ファイルの検出」と言う機能があり、他のファイルからリンクされていないファイルを検出出来ます。」

おー、これこれ。これです。知りたかったのは。やってみます。


4 ● ardarim
●22ポイント

ちょっと古いソフトですが、こんなのがあるようです。

窓の杜 - 【杜の道具箱 ?こんなとき、このソフト?】第130回:トップページから未参照のファイルを探すときの道具「孤島発見器」

「孤島発見器」は、HDDなどローカルドライブに保存してあるWebページをチェックし、リンクが張られていない画像やHTMLファイルを発見できるソフト。
関連質問


●質問をもっと探す●



0.人力検索はてなトップ
8.このページを友達に紹介
9.このページの先頭へ
対応機種一覧
お問い合わせ
ヘルプ/お知らせ
ログイン
無料ユーザー登録
はてなトップ