http://www.twitterholic.com/

require 'open-uri'

result = []
open('http://www.twitterholic.com/') do |f|
  f.each_line do |line|
    if line =~ %r|<td><a href="/twitter/([^/]+)/|
      result.push($1)
    end
  end
end

puts result.size
puts result

とりあえず条件は満たしてると思います。

moro · Answer 2 · 2008-09-06T10:56:15+09:00

HTMLパーサのHpricotをつかってみました。

$ gem install hpricot

入っていない場合、でインストールできます。

[screen_name, id]という配列の配列で取得しています。

#!/usr/bin/env ruby
# vim:set fileencoding=utf-8 filetype=ruby
$KCODE = 'u'

require 'rubygems'
require 'hpricot'
require 'open-uri'

uri = "http://www.twitterholic.com/"
selector = "div#wrapper > table > tbody > tr > td:nth(2) > a"

names = Hpricot(open(uri).read).search(selector).map do |e|
  e.inner_text.scan(/(.+)¥s¥((.+)¥)/).shift
end

p names

ケンキチ · Answer 3 · 2008-09-10T13:28:48+09:00

短めに書いてみました。

100個抜き出してくるとのことですが、任意の個数に変更する場合、3行目の行末の[0,100]の数値を変更して下さい。

require 'open-uri'
url = "http://www.twitterholic.com/"
p open(url).inject([]) {|r, e| (e =~ /a href="\/twitter\/(.+)\/"/) ? r << $1 : r }[0,100]

http://www.twitterholic.com/

回答（3件）

backupper95102008/09/06 07:22:23

moro23102008/09/06 10:56:15

ケンキチ212008/09/10 13:28:48

コメント（0件)

この質問への反応（ブックマークコメント）