セッションを利用しているネットサービスの情報をウェブプログラムによりスクレイピングで取得したい場合、どのようにすればよいのでしょうか。


http://mira.dokkyo.ac.jp/top/index.do?method=open

例えば、この図書館で「English」をキーワードにして蔵書検索を行った場合のGETリクエストのURLは http://mira.dokkyo.ac.jp/search/search.do?method=search&searchForm.library=true&searchForm.keyword=English になりますが、これはセッションが発行されていないUAでは無効になります。

もし、具体例を挙げてくださる場合はPHPで書いていただけるとわかりやすいです。

回答の条件
  • 1人2回まで
  • 登録:
  • 終了:2008/08/31 01:23:20
※ 有料アンケート・ポイント付き質問機能は2023年2月28日に終了しました。

ベストアンサー

id:pahoo No.1

回答回数5960ベストアンサー獲得回数633

ポイント64pt

多くのセッション・サイトでは、セッションIDが Cookie に格納されます。

サーバから送られてくる Cookie を受け取り(どのような名前に格納されるかは、解析しないと分かりません)、セッションページにアクセスする際にその Cookie を送出します。

PHP による Cookie の授受については、下記を参考にしてください。

id:leva

ありがとうございます。単に検索結果にリンクする場合はCookieを食わせるだけでよさそうですね。スクレイピングをするには一連の動作をcurlでやってみるのがベターですかね。

2008/08/30 21:58:12
  • id:pahoo
    > スクレイピングをするには一連の動作をcurlでやってみるのがベターですかね。

    curlの使い方をご存じであれば、それが手っ取り早いです。

この質問への反応(ブックマークコメント)

「あの人に答えてほしい」「この質問はあの人が答えられそう」というときに、回答リクエストを送ってみてましょう。

これ以上回答リクエストを送信することはできません。制限について

回答リクエストを送信したユーザーはいません