そのpageの google adsenseのリンク先を
(ブラウザではない)プログラムによって自動的に取得する方法があるでしょうか?
どうすればできるでしょうか?
こんにちは。ちょっと時間が無いので方法論だけ。
googleで「web scraping」等で検索すれば方法は見つかるとおもいます。
rubyでは以下のHPなんかで紹介されているライブラリがあります。
http://route477.net/rubyscraping/
で実際に何をやるかというと、このページのadsenseのリンクですが、
http://googleads.g.doubleclick.net/aclk?sa=l&ai=BldqLilL2SqqsMITwvgOP-tnDCMjz9pYB6POg_w3AjbcBwL2aLxABGAEgmJKlDSgDOABQp-XPkvv_____AWCJs8aE9BOyAQ5xLmhhdGVuYS5uZS5qcMgBAdoBIGh0dHA6Ly9xLmhhdGVuYS5uZS5qcC8xMjU3NjM4NTE2gAIBqQJVtUAFAr5HPsgC6PbyCqgDAegD8gPoAx_1AwAAAIQ&num=1&sig=AGiWqty_xxDe-Qal0cY8UEPVzaCyR7xeZA&client=ca-hatena-question_js&adurl=http://www.dreamvisor-fin.co.jp
のようになっています。
なので
1.指定URLにアクセス
2.ページのadsenseのURLを抜きだし
3.adsenseのURLの&adurl=以降を抜き出す
で要望の動作になるかと思います。(1、2、3の動作はscrapingのライブラリで大体実装されていると思います)
scrapingのライブラリ自体は言語によって色々あるのでお詳しい言語で探されるのが早いかと思います。
注意点はadsenseのリンクをクリックすることは厳禁です。またscraping自体行儀が悪いと色々と問題を起こしますので、あくまでそれぞれの利用規約内、かつ法令遵守で行って下さい。
コメント(0件)