下記のページに、
http://r.tabelog.com/tokyo/rstdtl/13018546/
「○○に関連するブログ記事へのリンク集です。
店名や電話番号などをキーワードにブログを検索し、自動抽出した結果です」
と書いてあります。
技術的にどうやればそんなことが出来るのでしょうか?
仮に電話番号リストがあるとして、何をすれば良いか御教示ください。
id:freewriter さん、こんにちは。
RSSを解析するのだろうなぁと考えたのですが、具体的にどうすればいいのか分からないので調べてみました。
http://kawa.at.webry.info/200602/article_11.html
via: http://itpro.nikkeibp.co.jp/article/COLUMN/20070726/278339/?P=2&...
RSSの解析には上記が便利なようです。
http://www.mashupedia.jp/webapis/view/256
http://www.mashupedia.jp/webapis/view/25
また、上記のようなAPIサービスがあることも分かりました。
さて、 http://r.tabelog.com/ がどのような技術を使っているのか分かりませんが、マッシュアップ事例の中で、私には仕組みが近く感じられるものがありましたので紹介させていただきます。以下です。
http://atodeiku.com/page/show/3244
via: http://www.mashupedia.jp/mashups/view/150
上記では、blog検索ではなくヤフーのウェブ検索が使われていますが、原理は同じかなぁと思いました。
http://www.mashupedia.jp/webapis/view/16
via: http://web-tan.forum.impressrd.jp/n/2006/12/05/558
http://hyoban.biglobe.ne.jp/books/
カスタマーレビューをデータマイニングし「よい」「わるい」に振り分けているのが興味深かったです。ご質問とは関係ないのですが、ご参考まで。
以上、お役に立てれば幸いです。
書いてある通りに店名や電話番号などをキーワードにして、ブログ検索をしているのではないでしょうか?
ブログ検索は(1)ブログを対象にした一般的検索エンジンや(2)ブログに特化した切り口で分析を加えるブログ特化型エンジンなどがあるかと思います。
これらのAPIにq=03-1234-5678としてやれば、03-1234-5678であるお店の情報について書かれたブログの記事が取れると思います。
そこからスパムなどを除去したり、各種フィルタを通したり、人間が目でチェックしたりしているのではないでしょうか?
(1)の例
Technorati (テクノラティ) ブログ検索
Yahoo!ブログ検索
http://blog-search.yahoo.co.jp/
Google ブログ検索
http://blogsearch.google.co.jp/
livedoor ブログ検索
Ask.jp : ブログ検索
(2)の例
ブログウォッチャー
きざし
ありがとうございます!出来そうな感じです
HPを5分見るだけで毎月22万円貰えます
食品会社のホームページを1日5分、都合の良い時間に見るだけで、毎月22万円もらえます。
下記サイトに、不定期ですが、お申し込み方法を記載します。
この報酬は18ヵ月で一旦終わりますので、退会会員が、発生のたびに新規会員を募集します。
おおよそですが、1日平均2~6人が、先着順で新規会員になれます。
下記サイトをお気に入りに登録いただき、こまめにチェックしてみてください。
これまでの履歴を見ると、PM8~AM2時の間に新規募集が掲載されるようです。
ありがとうございます!出来そうな感じです