人力検索はてな
モバイル版を表示しています。PC版はこちら
i-mobile

以下のような処理をJavaで実現したいと考えています。OSSライブラリやクローラを利用して構いませんので作り方を教えてください。ピンポイントのサンプルコードを提供していただけるとポイントを上乗せ致します。

(1)Webサイトのアドレス(http://www.xxxx.xxx/index.html)を指定。
(2)指定されたHTMLを取得する。
(3)指定されたHTMLからリンクされているファイルを取得する。
(4)リンク先がHTMLの場合は、再びリンク先のファイルを取得する。
(5)上記(3)と(4)を繰り返す。

これを実現しているフリーソフトはあると思いますが、取得したタイミングで独自処理を加えたいので、自作コーディングしたいと思います。宜しく御願い致します。

●質問者: er7
●カテゴリ:コンピュータ インターネット
✍キーワード:HTML Java OSS webサイト アドレス
○ 状態 :終了
└ 回答数 : 2/2件

▽最新の回答へ

1 ● wm5775
●16ポイント

Javaスパイダーツールサンプル&クックブック―自動アクセス&収集・加工プログラム (単行本)

http://www.amazon.co.jp/gp/product/4798010618/sr=11-1/qid=116472...

おぼろげな記憶ですが、この本にずばりそのものが書いてあったような気がします。

#具体的なコードでなくてすみません。

◎質問者からの返答

ありがとうございます!明日、本屋で覗いてみます。こういう回答でも全然okです。(もちろん、サンプルコードならもっと嬉しいですが。w)今後とも宜しく御願い致します。


2 ● kazu1107
●83ポイント

ではお言葉に甘えて。。。

Javaは専門外なのでお役に立てなさそうです;

http://q.hatena.ne.jp/

関連質問


●質問をもっと探す●



0.人力検索はてなトップ
8.このページを友達に紹介
9.このページの先頭へ
対応機種一覧
お問い合わせ
ヘルプ/お知らせ
ログイン
無料ユーザー登録
はてなトップ