今、あるウェブサイトのページネーションから、リンク先URLをすべて取得したいと思っています。
ですが、リンクの<a href="">の中身が"javascript:goPage(10)"のようになっていて、いまいち構造がつかめません。
jsファイルを実行して、goPage関数に値を渡すことで、URLが返ってくるようになっているのかと思ったのですがそうでもないようです。
最悪手動でも構わないので、このサイトのページネーションからURLを取得する方法をどなたかご教授いただけませんでしょうか?
サイトURLと、画像を下記に記載しておきます。どうかよろしくお願いします。
http://www.lottedfs.com/handler/Category-Main?categoryId=10001&tracking=LNB_COS
javascript の関数 goPage は、以下のようになってます。
function goPage(pageNo) { var frm = document.frmSearch; frm.pageNo.value = pageNo; frm.action = "http://www.lottedfs.com/handler/Category-Main"; frm.submit(); }
frmSearch という form に
した後に、submit して、ページを移動しています。
frmSearch という form は、以下のようになってます。
<form name="frmSearch" method="post" action=""> <input type="hidden" name="categoryId" value="10001" /> <input type="hidden" name="sOrderBy" value="1" /> <input type="hidden" name="pageNo" value="1" /> <input type="hidden" name="option" value="" /> <input type="hidden" name="vType" value="img" /> <input type="hidden" name="selChg" value="" /> <input type='hidden' name='SelectedBrandCdList' value="" /> <input type='hidden' name='SelectedBrandNmList' value="" /> <input type='hidden' name='CategoryBrandLayerVal' value="" /> <input type='hidden' name='SelectedContentsLayerVal' value="" /> ...
categoryId は必要だとして、他の値を省略して、GET でやってみました。
http://www.lottedfs.com/handler/Category-Main?pageNo=10&categoryId=10001
10ページ目へのリンクのつもりですが、なんか、きちんとページ遷移してるっぽいです。
最大のページ数は、右向きの三角がふたつになっている画像のリンクで確認できます。
質問にあるページだと、
href='javascript:goPage("189");'
となっているので、1~189 で全てのページになるはずです。
早速のご回答ありがとうございます!
2014/11/25 14:43:51拝見したところ、うまく動作しているようでとても助かります!
ただ、内容が僕の勉強不足でまだ理解しきれないのでまた質問させていただくかもしれません、、、
ありがとうございます!
どぞ、どぞ。
2014/11/25 14:45:29ぼくが分かることであれば :-)