約10年前に作成していたホームページが、インフォシークサービス停止で閲覧×になりました。
応急措置としてインターネットアーカイブのキャッシュへリンクさせようとしましたが、
どうも「一部のキャッシュは保存されていない」ようです。
キャッシュ保存例
http://itaru-m.hp.infoseek.co.jp/tetsuco/10.htm
↓
http://web.archive.org/web/20040507130031/http://itaru-m.hp.infoseek.co.jp/tetsuco/10.htm
キャッシュ非保存例
http://itaru-m.hp.infoseek.co.jp/tetsuco/9.htm
インターネットアーカイブは、全部のファイルを保存するものではないのでしょうか?
或いは公開までタイムラグがあるのでしょうか?
Internet Archiveはすべてを保存しているわけではありません。
具体的な仕様は知りませんが
保存しないようになっている種類のデータがあるか
自動収集システムからのアクセスを阻むサーバーがあるか
(動的ページ生成がなされる場合など保存されていないと思います)
なんらかの事情で保存されていないデータがあります。
そのデータの公開直後の日時のアーカイブからのリンクが
正常に繋がっていないのであれば
おそらく、そのデータ自体が保存されていないと考えられます。
http://okwave.jp/qa/q4329748.html
ただし、閉鎖された過去のサイトがすべて完全に見られるわけではなく、HTMLファイル以外は保存されないこともある。保存に成功したサイトであっても、年数経過によりアーカイブ上からでも見られなくなることがある。
閉鎖サイトを閲覧するためのサイトであって閉鎖サイトにアップロードされていたファイルのアーカイブではないそうです。
ダウンロードのリンクがあってもダウンロードできないのは当たり前でダウンロードできる方が珍しいです。
作成者の承諾なしに第三者が勝手に誰もがダウンロードできるようにしたのでは著作権の侵害にも繋がります。
回答ありがとうございます。
2012/08/09 11:49:04>保存しないようになっている種類のデータがあるか
>自動収集システムからのアクセスを阻むサーバーがあるか
どちらもあまり考えられないんですよね・・・
例示の通り、保存されているキャッシュと、保存されていない
キャッシュが混在しています。
データの形式も重さも日時も似たり寄ったりなんですが。
仮に
「自動収集システムからのアクセスを阻むサーバー」
とかあるのなら、全部保存されてないと思うのですが。