楽天市場内のショップの商品のURLは、下記のようになっているのですが、

http://item.rakuten.co.jp/ショップドメイン/商品番号/”
実際下記のようになります。
http://item.rakuten.co.jp/donya/70069-ss/
これは、”donya”の下に”70069-ss”というフォルダーがあって、その下に”index.html”という
ファイルがあると思われます。

そこで、このdonyaの下にどのようなフォルダーがあるのかすべて抽出するようなソフトをご存じないでしょうか?

その下のファイルURLがすべてわかるようなソフトです。
そのすべてのURLをエクセルやcsvファイルで取り出すようなソフトを探しております。

回答の条件
  • 1人1回まで
  • 登録:2007/12/17 16:00:47
  • 終了:2007/12/24 16:05:02

回答(2件)

id:mass3 No.1

mass3回答回数118ベストアンサー獲得回数152007/12/17 19:00:25

ポイント35pt

目的と自分でどこまでできるのかのスキルがわからないのでだめかもしれませんが、

簡単なプログラムを組める人が特定のショップの全取扱商品を取得することを仮定してみます。

楽天Webサービスを使えばできます。

http://webservice.rakuten.co.jp/api/itemsearch/

でも、ちょっと制限がでそうですね。

試してみたんですが、donyaの商品は全部で3299個あるようでした。

楽天商品検索APIは1ページに最大30個ずつ、100ページまで出力できます。

つまり最大3000件までしか取得できませんでした。

これはジャンルID=0で検索しているからで、ジャンルIDを変えながら検索して

その結果の和を求めれば回避できるんですけど、取得に時間がかかりそうです。

目的次第ではこれで十分だと思いますけど。

id:y-kawaz No.2

y-kawaz回答回数1419ベストアンサー獲得回数2252007/12/17 19:12:02

ポイント35pt

一発でそれを行うソフトではないですが、Googleを使ってある程度それっぽいものが取れますね。

site:item.rakuten.co.jp/donya/ でGoogle検索

今だと 4,280 件ヒットするようなので、100件ずつ高々43ページを巡回すればURLリストが作れそうです。

コメントはまだありません

この質問への反応(ブックマークコメント)

「あの人に答えてほしい」「この質問はあの人が答えられそう」というときに、回答リクエストを送ってみてましょう。

これ以上回答リクエストを送信することはできません。制限について

絞り込み :
はてなココの「ともだち」を表示します。
回答リクエストを送信したユーザーはいません