Googleのリアルタイム検索でtwitterの投稿が対象になりましたが、あれは技術的にどうやっているのでしょうか?インデックス云々ではなくtwitterから情報を取得する部分の質問です。

真似るとして、twitterのAPIを叩きまくるのも気が引けてしまいます。

事実である証拠があると嬉しいですが、理由を踏まえていれば予測でも構いません。

回答の条件
  • URL必須
  • 1人2回まで
  • 登録:
  • 終了:2010/02/23 07:26:29
※ 有料アンケート・ポイント付き質問機能は2023年2月28日に終了しました。

ベストアンサー

id:tsupo No.2

回答回数25ベストアンサー獲得回数1

ポイント50pt

Twitter の方でも回答しましたが、こちらでも回答します。

Google のリアルタイム検索は Twitter の Streaming API のうち、firehose というのを使っています。

Streaming API は、最初、Facebook や friendfeed 向けに試験的に公開されていた API ですが、いまは一般公開されています。ただし、一部、Twitter 側と契約を結ばないと使えないものもあり、今回、Google が利用している API は、「Twitter 側との契約を結ばないと使えないもの」になります。

id:hoisjp

ありがとうございます。

> Twitter 側と契約を結ばないと使えないもの

実はこういう懸念もしていたんですが、やはりそうですか・・・


以下についても調べてみます。

・契約なしでどこまで使えるか。

・契約はどういったものか。(いくらか。)

 #ざっくり見た感じ、契約内容は非公開でしょうね。

2010/02/20 07:32:18

その他の回答2件)

id:yuuta11 No.1

回答回数23ベストアンサー獲得回数2

ポイント10pt

http://markezine.jp/article/detail/7544はどうですか?

id:hoisjp

Twitter Search

http://search.twitter.com/

ありがとうございます。

求めている機能としてはこのままなんですが、APIは公開されているものなんですかね。

2010/02/20 07:26:47
id:tsupo No.2

回答回数25ベストアンサー獲得回数1ここでベストアンサー

ポイント50pt

Twitter の方でも回答しましたが、こちらでも回答します。

Google のリアルタイム検索は Twitter の Streaming API のうち、firehose というのを使っています。

Streaming API は、最初、Facebook や friendfeed 向けに試験的に公開されていた API ですが、いまは一般公開されています。ただし、一部、Twitter 側と契約を結ばないと使えないものもあり、今回、Google が利用している API は、「Twitter 側との契約を結ばないと使えないもの」になります。

id:hoisjp

ありがとうございます。

> Twitter 側と契約を結ばないと使えないもの

実はこういう懸念もしていたんですが、やはりそうですか・・・


以下についても調べてみます。

・契約なしでどこまで使えるか。

・契約はどういったものか。(いくらか。)

 #ざっくり見た感じ、契約内容は非公開でしょうね。

2010/02/20 07:32:18
id:tsupo No.3

回答回数25ベストアンサー獲得回数1

ポイント20pt

契約に関しては、各自が Twitter 側と個別交渉することになります。たぶん、交渉相手となるには何らかの組織の体(会社、NPO、など)を成している必要があるでしょう。

契約なしでどこまで使えるかは、Streaming API 自身に書かれています。日本語で読みたい場合は、Twitter API 日本語訳の「ストリーミング API」の項目のところを見てください。

要約すると

  • public_timelinme 取得系
    • firehose public_timeline 丸ごと全部 (特定の組織にのみ公開)
    • gardenhose firehose より精度が落ちる (情報抜けがある) (契約が必要)
    • sample gardenhose よりさらに精度が落ちる (情報抜けが多い。REST API の public_timeline 取得とほぼ同じか少し上の精度) (契約は不要)
  • 検索結果取得系
    • birddog 最大40万ユーザを追跡可能 (特定の組織にのみ公開)
    • shadow 最大8万ユーザを追跡可能 (契約が必要)
    • partner 契約版の track 最大20万キーワードの追跡が可能 (契約が必要)
    • restricted 契約版の track 最大1万キーワードの追跡が可能 (契約が必要)
    • filter 最大400ユーザ(follow)、200キーワード(track)の追跡が可能 (契約不要)
    • links URLを含むすべての public な tweet を取得 (いまのところ非公開)
    • retweet retweet された tweet をすべて取得 (いまのところ非公開)

という感じになります。

id:hoisjp

ありがとうございます。とても参考になりました。

契約不要な範囲はなかなか限られてくるものですね。

2010/02/23 07:23:54

この質問への反応(ブックマークコメント)

トラックバック

「あの人に答えてほしい」「この質問はあの人が答えられそう」というときに、回答リクエストを送ってみてましょう。

これ以上回答リクエストを送信することはできません。制限について

回答リクエストを送信したユーザーはいません