プログラムからブログ記事を収集(クロール)、を実装したいのですが、手軽な方法はあるでしょうか?

(特定のブログサービスのRSSを指定して取得、はなしでお願いします)

回答の条件
  • 1人2回まで
  • 登録:2010/02/02 00:51:39
  • 終了:2010/02/09 00:55:02

回答(3件)

id:niwa-mikiho No.1

niwa-mikiho回答回数508ベストアンサー獲得回数382010/02/02 01:33:26

ポイント27pt

PHP なり Perl でページを取得して、正規表現で抜き出し、それらデータをログに書き出す。


それらを行うスクリプトを、Linux なら cron、Windows ならタスクに登録すればいいかと思います。

id:TAK_TAK No.2

tak回答回数995ベストアンサー獲得回数832010/02/02 09:16:58

ポイント26pt

RSS以外で効率的にURLを収集する方法があるかどうかわかりませんが、

まず、blogのURLを収集

それらのURLをプログラムでダウンロード → 保存

するだけです。



それ以上は質問内容の詳細がわからないと答えようがありません

id:e55ind No.3

e55ind回答回数162ベストアンサー獲得回数42010/02/02 06:04:38

ポイント27pt

YahooAPIで、ブログの検索を行い、

このときURLが取得できるので、

再度そのURLを読み込んで記事を取り込んだりします。

  • id:TAK_TAK
    特定のブログサービスのRSSを指定して取得、はなし
    といっても

    この方法がだめなら他は無理ではないかと思うのですが



    どのレベルのプログラムが知りた
    いのでしょうか

この質問への反応(ブックマークコメント)

「あの人に答えてほしい」「この質問はあの人が答えられそう」というときに、回答リクエストを送ってみてましょう。

これ以上回答リクエストを送信することはできません。制限について

絞り込み :
はてなココの「ともだち」を表示します。
回答リクエストを送信したユーザーはいません