人力検索はてな
モバイル版を表示しています。PC版はこちら
i-mobile

膨大な量のHTMLやJSPのコンテンツがあります。各コンテンツにはもちろん、リンク先が存在します。内部のコンテンツへの相対リンクだったり、外部への絶対リンクだったり、様々です。リンクの仕方は必ずしも<a href....ではない(かもしれない)です。
さて、そのコンテンツに含まれているリンク先を全て洗い出すという作業が必要になりました。
なにしろ1,000ファイルくらいは(少なくとも)あるので、ハンド作業では到底無理。
そのリンク先を抽出する方法を教えてください。
環境:win98SEもしくはXP
条件:aaaa.htmlには「bbbb.html bbbbの仕方ページ」「http://www.aaaa.com/cccc.html aaaa株式会社」のように、リンク先のタイトル情報?を一緒に拾ってくれることが条件
あわよくば、リンク先が生きているかどうかの確認もできると嬉しい。

できればフリーのソフトでお願いします。

●質問者: emmet
●カテゴリ:ウェブ制作
✍キーワード:href HTML JSP XP いるか
○ 状態 :終了
└ 回答数 : 2/2件

▽最新の回答へ

1 ● hinop
●30ポイント

http://www.vector.co.jp/soft/win95/net/se121280.html

ホームページからリンク先を抽出の詳細情報 : Vector ソフトを探す!

1番目のURLでできるようです。

ただし、2番目のソフトであらかじめダウンロードしなければいけないかもしれませんが・・。

http://www.vector.co.jp/soft/win95/net/se247055.html

Website Explorer(ウェブサイト・エクスプローラ)の詳細情報 : Vector ソフトを探す!

◎質問者からの返答

ありがとうございます。

ダウンロードしてみました。ファイル単位での作業になるんですね。これをディレクトリ単位でできたらもっと素晴らしいのにと思いました。

引き続き、情報を求めます。


2 ● hebe
●30ポイント

*nix (Unix,Linux,FreeBSD..) 使いに頼みましょう。速攻終わります。

Windows でも Cygwin や SFU があるので無問題。

餅は餅屋です。こういう時のためにプログラマが居るんです。JSP 扱っているのなら近所にいらっしゃるかと。

◎質問者からの返答

ありがとうございます。

目の前に座ってるので、頼んでみます^^

関連質問


●質問をもっと探す●



0.人力検索はてなトップ
8.このページを友達に紹介
9.このページの先頭へ
対応機種一覧
お問い合わせ
ヘルプ/お知らせ
ログイン
無料ユーザー登録
はてなトップ