はてなの過去の質問・回答データを取り出すプログラムを教えてください('-'*)



統計的データを作りたいです。
はてなのスタッフさんの話では公開してあるデータなら集めても問題ないそうです。

http://q.hatena.ne.jp/1180747985#c91079

現状では、すでに公開されているデータを取得し集計や加工して公開すること自体が迷惑行為や不適切な行為であるとはいえなくなっており、したがって利用規約で定める禁止事項には該当しないと考えております。

私もこんな感じでみんなのランキング作って公開してみたいです\(⌒▽⌒)/
http://briefcase.yahoo.co.jp/bc/jinriki_me/vwp2?.tok=bcu1w2YBR9ILm41i&.dir=/928f&.dnm=%b2%f3%c5%fa%a5%b0%a5%ec%a1%bc%a5%c9%a1%ca2007.1-2%a1%cb.xls&.src=bc

回答の条件
  • URL必須
  • 1人2回まで
  • 登録:2007/06/06 23:12:24
  • 終了:2007/06/13 23:15:03

回答(3件)

id:hamster000 No.1

hamster000回答回数6ベストアンサー獲得回数12007/06/06 23:37:02

ポイント35pt

おんなじもん2つも(゚⊿゚)イラネ。カーッ(゚Д゚≡゚д゚)、ペッ。

 

http://end

id:yume22

いじわる><

後、言語は何でもいいですが、Windowsで動くと嬉しいです。

2007/06/07 00:25:19
id:betz No.2

betz回答回数4ベストアンサー獲得回数02007/06/07 07:11:15

ポイント35pt

過去の質問のURLを取り出すスクリプト(Ruby)

page*20問の過去の質問のURLを取り出します。

スーパーpre記法がおかしいですね。

「&」→「&」に変えてください。

require "rexml/document"
require 'open-uri'

page=3

i = 1
while true
  s="http://q.hatena.ne.jp/list?page=#{i}&mode=rss"
  doc = REXML::Document.new open(s)
  if doc and i<= page then
    REXML::XPath.match(doc,"//item/link").each do |j|
      puts j.text
    end
    i=i+1
  else
    break
  end
end

http://q.hatena.ne.jp/answer

id:yume22

RSSフィードを読んでるんですね。

2007/06/07 07:21:37
id:F-15X No.3

F-15X回答回数111ベストアンサー獲得回数132007/06/06 23:50:46

ポイント10pt

エクセルやアクセスのマクロとかで手軽に作ってみてはいかがかと。

ポイントは、

・XMLHTTP オブジェクト
  これでページの内容を取得
・RegExp オブジェクト
  正規表現で目的の内容を抜く
・エクセルだったらシートに書き出す。アクセスだったらテーブルに格納。

以下、参考にしてがんがって下さい。

Web ページをダウンロードする方法~ MSXML 編~

コメントはまだありません

この質問への反応(ブックマークコメント)

「あの人に答えてほしい」「この質問はあの人が答えられそう」というときに、回答リクエストを送ってみてましょう。

これ以上回答リクエストを送信することはできません。制限について

絞り込み :
はてなココの「ともだち」を表示します。
回答リクエストを送信したユーザーはいません