Hpricotを使ってGoogle の検索結果のページから情報を取りだしたいのです。

具体的には、検索結果の中にある
”netcommons の検索結果 約 117,000 件” の 117,000の部分を整数として取り出したいのです。
http://kazuhiro.ty.land.to/blog/2007/02/googlerest_api_ruby.html の g.rb をどう改造したらいいのでしょうか?

回答の条件
  • URL必須
  • 1人2回まで
  • 登録:2007/10/21 23:23:24
  • 終了:2007/10/22 01:24:21

ベストアンサー

id:tmasao No.1

tmasao回答回数76ベストアンサー獲得回数202007/10/22 00:36:19

ポイント60pt

元のコードの部分:

uri = URI.parse( BASE_URL + paramString )

doc = Hpricot( open(uri) )

のすぐあとに、

hit_num = doc.search("//td[@align='right']/font[@size='-1']/b")[2].inner_html.to_i

とすればとりだせます。

# HTMLがうまいこと構造化されていないので、かなり泥臭いですが・・・

id:isogaya

ありがとうございます。なんとかなりそうです。

2007/10/22 01:14:02

コメントはまだありません

この質問への反応(ブックマークコメント)

「あの人に答えてほしい」「この質問はあの人が答えられそう」というときに、回答リクエストを送ってみてましょう。

これ以上回答リクエストを送信することはできません。制限について

絞り込み :
はてなココの「ともだち」を表示します。
回答リクエストを送信したユーザーはいません