人力検索はてな
モバイル版を表示しています。PC版はこちら
i-mobile

楽天市場内のショップの商品のURLは、下記のようになっているのですが、
”http://item.rakuten.co.jp/ショップドメイン/商品番号/”
実際下記のようになります。
”http://item.rakuten.co.jp/donya/70069-ss/”
これは、”donya”の下に”70069-ss”というフォルダーがあって、その下に”index.html”という
ファイルがあると思われます。

そこで、このdonyaの下にどのようなフォルダーがあるのかすべて抽出するようなソフトをご存じないでしょうか?

その下のファイルURLがすべてわかるようなソフトです。
そのすべてのURLをエクセルやcsvファイルで取り出すようなソフトを探しております。

●質問者: urutoraman_reo
●カテゴリ:インターネット ウェブ制作
✍キーワード:CSV HTML INDEX ss URL
○ 状態 :終了
└ 回答数 : 2/2件

▽最新の回答へ

1 ● mass3
●35ポイント

目的と自分でどこまでできるのかのスキルがわからないのでだめかもしれませんが、

簡単なプログラムを組める人が特定のショップの全取扱商品を取得することを仮定してみます。

楽天Webサービスを使えばできます。

http://webservice.rakuten.co.jp/api/itemsearch/

でも、ちょっと制限がでそうですね。

試してみたんですが、donyaの商品は全部で3299個あるようでした。

楽天商品検索APIは1ページに最大30個ずつ、100ページまで出力できます。

つまり最大3000件までしか取得できませんでした。

これはジャンルID=0で検索しているからで、ジャンルIDを変えながら検索して

その結果の和を求めれば回避できるんですけど、取得に時間がかかりそうです。

目的次第ではこれで十分だと思いますけど。


2 ● y-kawaz
●35ポイント

一発でそれを行うソフトではないですが、Googleを使ってある程度それっぽいものが取れますね。

site:item.rakuten.co.jp/donya/ でGoogle検索

今だと 4,280 件ヒットするようなので、100件ずつ高々43ページを巡回すればURLリストが作れそうです。

関連質問


●質問をもっと探す●



0.人力検索はてなトップ
8.このページを友達に紹介
9.このページの先頭へ
対応機種一覧
お問い合わせ
ヘルプ/お知らせ
ログイン
無料ユーザー登録
はてなトップ