Pythonの質問です。

Twitterに存在する全ツイートから、ある一定の単語(日本語の単語)を使っているツイートだけを抜き出したいのですが、
上記のことが出来るスクリプトがありましたら教えていただけるとありがたいです。
なお、現在python-twitterを使用しています。

回答の条件
  • 1人5回まで
  • 13歳以上
  • 登録:2010/10/01 06:23:09
  • 終了:2010/10/08 06:25:03

回答(2件)

id:showyou No.1

showyou回答回数96ベストアンサー獲得回数102010/10/01 07:27:00

ポイント35pt

直接の答えは出せないですがいくつかヒントだけ置いておきます。

これを実現するには

  1. TwitterからTweetを抜き出す
  2. Tweet文から文字列を抽出する

と言った手順に分割出来るかと思います。

1については「python-twitter」でググるといくつか出てくるかと思います。

http://techno-st.net/2009/07/04/python-twitter.htmlとか。

2に関しては、文字列の操作関数、または正規表現を使うといいと思います。

一例としてtextという文字列から"おはよう"が含まれる内容を抜き出したければ、

import re

def pick_up_ohayou(text):

if( (matches = re.search(u"おはよう",text))!=None ):

return True

return False

などとやればいいかと思います。(コード先頭にタブかスペースを適宜入れてください)

http://www.python.jp/Zope/articles/tips/regex_howto/regex_howto_...

id:naoeco

1.すいません、質問で書いたようにPython-Twitterを使っているのですが、20件しか取れないことはないですか?他の方法があるのかな・・・

2.はありがとうございます!正規表現なんとなくしか分かっていないので、復習しておきます。

2010/10/02 01:39:11
id:showyou No.2

showyou回答回数96ベストアンサー獲得回数102010/10/03 14:53:09

ポイント35pt

(Public Timelineが)1回の呼出しで20件しか取れないのはpython-twitterじゃなくてTwitter API側の仕様です。一定時刻ごとに収集するかStreaming API使わないと多くの発言は取れないです。それでもせいぜい全発言の5%くらいしか取れません(Firehoseならもっと取れるだろうけど)。

User TimeLineならpageなりcountなりの引数変えてあげればいいのではないでしょうか?


http://watcher.moe-nifty.com/memo/docs/twitterAPI.txt

http://python-twitter.googlecode.com/hg/doc/twitter.html#Api-Get...

id:naoeco

うーん、なるほど・・・

引き続き解答募集します。

2010/10/03 22:59:56

コメントはまだありません

この質問への反応(ブックマークコメント)

「あの人に答えてほしい」「この質問はあの人が答えられそう」というときに、回答リクエストを送ってみてましょう。

これ以上回答リクエストを送信することはできません。制限について

絞り込み :
はてなココの「ともだち」を表示します。
回答リクエストを送信したユーザーはいません