プログラムからブログ記事を収集(クロール)、を実装したいのですが、手軽な方法はあるでしょうか?

(特定のブログサービスのRSSを指定して取得、はなしでお願いします)

回答の条件
  • 1人2回まで
  • 登録:
  • 終了:2010/02/09 00:55:02
※ 有料アンケート・ポイント付き質問機能は2023年2月28日に終了しました。

回答3件)

id:niwa-mikiho No.1

回答回数516ベストアンサー獲得回数40

ポイント27pt

PHP なり Perl でページを取得して、正規表現で抜き出し、それらデータをログに書き出す。


それらを行うスクリプトを、Linux なら cron、Windows ならタスクに登録すればいいかと思います。

id:TAK_TAK No.2

回答回数1133ベストアンサー獲得回数103

ポイント26pt

RSS以外で効率的にURLを収集する方法があるかどうかわかりませんが、

まず、blogのURLを収集

それらのURLをプログラムでダウンロード → 保存

するだけです。



それ以上は質問内容の詳細がわからないと答えようがありません

id:e55ind No.3

回答回数162ベストアンサー獲得回数4

ポイント27pt

YahooAPIで、ブログの検索を行い、

このときURLが取得できるので、

再度そのURLを読み込んで記事を取り込んだりします。

  • id:TAK_TAK
    特定のブログサービスのRSSを指定して取得、はなし
    といっても

    この方法がだめなら他は無理ではないかと思うのですが



    どのレベルのプログラムが知りた
    いのでしょうか

この質問への反応(ブックマークコメント)

「あの人に答えてほしい」「この質問はあの人が答えられそう」というときに、回答リクエストを送ってみてましょう。

これ以上回答リクエストを送信することはできません。制限について

回答リクエストを送信したユーザーはいません