人力検索はてな
モバイル版を表示しています。PC版はこちら
i-mobile

1万個のURLが書かれたテキストファイルの中から、404や403などのエラーでアクセスできないURLを除去し、アクセスできるURLのみにする方法はありますか?

テキストファイルは、1行に1URLです。Windows XPを使用しています。CygwinとPHPも入っているので、コマンドなどを使ったやり方でも結構です。

●質問者: hkn
●カテゴリ:コンピュータ
✍キーワード:403 cygwin PHP URL Windows XP
○ 状態 :終了
└ 回答数 : 4/4件

▽最新の回答へ

1 ● kanetetu
●18ポイント

http://mac-news.net/soft/mac-html.html

Mac WWW/HTML Making Softwares

Big Brother が便利ですよ。

テキストの正規表現でHTMLにし

このソフトを利用するといいですよ。

◎質問者からの返答

ありがとうございます。Cygwinで動くということですかね? 調べてみます。


2 ● nkysn
●18ポイント

http://web.paulownia.jp/script/ajax/xmlhttp2.html

web.paulownia.jp - XMLHttpRequestの使い方2

Wsh(VBscript)の例ですが、xmlhttpオブジェクトを使えば、statusプロパティにレスポンスコードが

返されます。


Set xmlhttp = Wscript.CreateObject(”Microsoft.XMLHTTP”)

xmlhttp.open ”GET”, ”http://www.yahoo.co.jp/”, false

xmlhttp.send()

msgbox(xmlhttp.status)

http://www.roy.hi-ho.ne.jp/mutaguchi/wsh/refer/lesson15.htm

Lesson15

あとはURLのファイルを入力にして1件ずつsendして正常なURLのみを吐き出すという方法はいかがでしょうか?

◎質問者からの返答

ありがとうございます。しかし、すみませんが、私の理解できる範囲を超えています。無知でスミマセン。


3 ● tarulen
●17ポイント

http://www.forest.impress.co.jp/article/2000/06/01/okiniiri.html

????m - ?y????????C??????z?e?L?X?g??HTML????uWHTM Limited Edition?vv1.05.14

回りくどいですが、一度テキストをリンク付きにのhtmlにします

http://hp.vector.co.jp/authors/VA014575/chicchi/

?`?b?`?????

次に、リンクチェックソフトで、htmlファイルをチェックします

http://www.vector.co.jp/soft/win95/net/se146069.html

LINK@internet(Windows95/98/Me / インターネット&通信)

これ、windows95だけど使えるかな?

◎質問者からの返答

ありがとうございます。HTMLファイルをチェックするソフトならあるんですね。使ってみます。


4 ● tarulen
●17ポイント

http://www.kumacchi.com/soft/iefck/iefck.html

Internet Explorer お気に入りリンク切れチェッカー

二度すみません、html化したファイルをIEのお気に入りにインポートして、この「Internet Explorer お気に入りリンク切れチェッカー」を使うというのはどうですか?リンク切れの場合削除できるみたいです

◎質問者からの返答

こんなのもあるんですね。ありがとうございます。

関連質問


●質問をもっと探す●



0.人力検索はてなトップ
8.このページを友達に紹介
9.このページの先頭へ
対応機種一覧
お問い合わせ
ヘルプ/お知らせ
ログイン
無料ユーザー登録
はてなトップ