file_get_contentsやcurlだとJavascript実行「前」のhtmlになってしまうので、Javascript実行「後」のhtmlを取得する方法を知りたいです。
コメントからコピペ。
PhantomJSをインストールしてshell_exec()で……というのがまず頭に浮かんだ(試したことはない)。
http://stackoverflow.com/questions/24300717/running-phantomjs-from-php-with-exec
poletaewという人が、php-phantomjs and PhantomJS Runnerをかわりに使えと言っているのが気になる。
Yahoo!知恵袋に似た質問を発見
http://detail.chiebukuro.yahoo.co.jp/qa/question_detail/q14138678874
Selenium2を使うという方法があるようだ。
Yahoo Pipes!みたいなものでJavaScript実行後のHTMLを取得できるようなものは
ないのだろうか?
ついでにこの質問に出会った感想でも書いておこうかな。
ブラウザでJavaScriptを無効にする人は昔と比べるとだいぶ減ったから
JavaScriptに依存したWebページのアクセシビリティの問題は気にしない人が増えていて、
自分もそうなりつつあるのですが、
PHPとかでスクレイピングするというWebページの利用のされかたも想定しないとなーと
ちょっと考えさせられました。まる。
Webスクレイピングのことでしょうか。
Webスクレイピングの場合は、
http://www.buildinsider.net/web/bookphplib100/088
のサイトが参考になるかもしれません。
http://blog.asial.co.jp/1316
http://stackoverflow.com/questions/24300717/running-phantomjs-from-php-with-exec
poletaewという人が、php-phantomjs and PhantomJS Runnerをかわりに使えと言っているのが気になる。
Yahoo!知恵袋に似た質問を発見
http://detail.chiebukuro.yahoo.co.jp/qa/question_detail/q14138678874
Selenium2を使うという方法があるようだ。
Yahoo Pipes!みたいなものでJavaScript実行後のHTMLを取得できるようなものは
ないのだろうか?
PhantomJS
との組み合わせで何とかなりそうです。
ポイントを差し上げたいので、良ければ年内くらいに回答欄に記載頂ければ幸いです。