人力検索はてな
モバイル版を表示しています。PC版はこちら
i-mobile

はてなの過去の質問・回答データを取り出すプログラムを教えてください('-'*)


統計的データを作りたいです。
はてなのスタッフさんの話では公開してあるデータなら集めても問題ないそうです。

http://q.hatena.ne.jp/1180747985#c91079

現状では、すでに公開されているデータを取得し集計や加工して公開すること自体が迷惑行為や不適切な行為であるとはいえなくなっており、したがって利用規約で定める禁止事項には該当しないと考えております。

私もこんな感じでみんなのランキング作って公開してみたいです\(⌒▽⌒)/
http://briefcase.yahoo.co.jp/bc/jinriki_me/vwp2?.tok=bcu1w2YBR9ILm41i&.dir=/928f&.dnm=%b2%f3%c5%fa%a5%b0%a5%ec%a1%bc%a5%c9%a1%ca2007.1-2%a1%cb.xls&.src=bc

●質問者: yume22
●カテゴリ:はてなの使い方 コンピュータ
✍キーワード:はてな スタッフ データ プログラム ランキング
○ 状態 :終了
└ 回答数 : 3/3件

▽最新の回答へ

1 ● hamster000
●35ポイント

おんなじもん2つも(゚?゚)イラネ。カーッ(゚Д゚≡゚д゚)、ペッ。

http://end

◎質問者からの返答

いじわる><

後、言語は何でもいいですが、Windowsで動くと嬉しいです。


2 ● betz
●35ポイント

過去の質問のURLを取り出すスクリプト(Ruby)

page*20問の過去の質問のURLを取り出します。

スーパーpre記法がおかしいですね。

「&」→「&」に変えてください。

require "rexml/document"
require 'open-uri'

page=3

i = 1
while true
 s="http://q.hatena.ne.jp/list?page=#{i}&mode=rss"
 doc = REXML::Document.new open(s)
 if doc and i<= page then
 REXML::XPath.match(doc,"//item/link").each do |j|
 puts j.text
 end
 i=i+1
 else
 break
 end
end

http://q.hatena.ne.jp/answer

◎質問者からの返答

RSSフィードを読んでるんですね。


3 ● F-15X
●10ポイント

エクセルやアクセスのマクロとかで手軽に作ってみてはいかがかと。

ポイントは、

・XMLHTTP オブジェクト
  これでページの内容を取得
・RegExp オブジェクト
  正規表現で目的の内容を抜く
・エクセルだったらシートに書き出す。アクセスだったらテーブルに格納。

以下、参考にしてがんがって下さい。

Web ページをダウンロードする方法? MSXML 編?

関連質問


●質問をもっと探す●



0.人力検索はてなトップ
8.このページを友達に紹介
9.このページの先頭へ
対応機種一覧
お問い合わせ
ヘルプ/お知らせ
ログイン
無料ユーザー登録
はてなトップ