人力検索はてな
モバイル版を表示しています。PC版はこちら
i-mobile

ホームページ作成においての質問です。
自サイトの一部分に、他サイトの一部分HTMLソースを読み込む方法をご存知の方。
その方法と、スクリプトが絡む場合はソースまで教えて頂きたいです。

●質問者: testaishi
●カテゴリ:コンピュータ ウェブ制作
○ 状態 :終了
└ 回答数 : 1/1件

▽最新の回答へ

1 ● TransFreeBSD
ベストアンサー

そういうのをスクレイピングとか言ったりします。
言語が書いてないのでリンクで。
http://q.hatena.ne.jp/1329396133#a1132280
http://q.hatena.ne.jp/1318845421#a1110970
http://q.hatena.ne.jp/1289494707#a1046396
http://q.hatena.ne.jp/1285149069
あと、スクレイピング+言語名でググると色々出てきます。


testaishiさんのコメント
こんなソースがあるのですが、この場合、 JavaScript+スクレイピングと言う事でしょうか? ========================================= <html> <head> <title>タイトル</title> <!-------------------- SHAME --------------------> <script type="text/javascript"> $(document).ready(function() { $("#photodiary_box>ul>li").load("/mailbbs/logs/mailbbs.html #diary_photo"); }); </script> <!-------------------- end SHAME --------------------> <!---------------------- SHAME SPACE ----------------------> <div id="dialy_space"> <h3>写メ日記</h3> <div id="photodiary_box"> <ul><li class="photo_diary"></li></ul> </div> </div> <!---------------------- end SHAME SPACE ----------------------> </body> </html> =========================================

TransFreeBSDさんのコメント
これだけだと「自サイトの"/mailbbs/logs/mailbbs.html"の一部を読み込んでる」というのしか分かりません。 その読んでるページが他所のサイトのページから作ったのならスクレイピングしてるってことになりますけど、外からそれは分かりません。 読んでる先のサイトが分かってれば比較することで推測できるかも知れませんが、逆の可能性もありますしね。

TransFreeBSDさんのコメント
補足 スクレイピング=ウェブページをとってきて必要な部分を取り出す事 です。取り出した部分を自分のPCに保存するのかページ作ってアップロードするのか、自分のページに埋め込むのか、その後の事は別の話です。

testaishiさんのコメント
参考にしたサイトをお知らせします。 http://www.bucho-kacho.jp/home/ 画面右下にある写メ日記のコンテンツが、 http://www.cityheaven.net/k/bucho_kacho/A5GirlKeitaiDiaryList/ ココからの引用の様です。 また、 http://www.bucho-kacho.jp/home/のソース内にある、 http://www.bucho-kacho.jp/mailbbs/logs/mailbbs.htmlには、 http://www.cityheaven.net/k/bucho_kacho/A5GirlKeitaiDiaryList/から 抜粋引用している様です。 僕がイメージするに、 何かしらの方法で、 http://www.cityheaven.net/k/bucho_kacho/A5GirlKeitaiDiaryList/からHTMLを引用し、 http://www.bucho-kacho.jp/mailbbs/logs/mailbbs.htmlに受け渡し、 http://www.bucho-kacho.jp/home/で読み込んでいる。 この方法を実現したいのですが、改めてご教授願います。

TransFreeBSDさんのコメント
その考察であっていると思います。 実際のページへの読み込みはコメントに書かれている通りで、javascriptでjqueryを使っています。 余所のサイトからとってきて加工するのがスクレイピングで、phpなら回答にリンクしたSimpleHTMLDOMParser、perlならWeb::QueryとかWeb::Scraper、pythonはpyqueryとかBeautifulSoup、rubyはNokogiriとかHpricotとか?、javaは普通にxmlとして処理するかWeb-Harvestってのがあるらしい。 典型的にはcronとか使って定期的に処理させる。 定期的にアクセスさせるサービス使ってCGIとして処理させる方法もある。 手元のパソコンなどで定期的に処理してアップロードまで自動でさせる方法もある。 言語やライブラリ、処理方法は環境に合わせて設計してください。

testaishiさんのコメント
SimpleHTMLDOMParserを利用し、何とか実現できました! 感謝致します。
関連質問

●質問をもっと探す●



0.人力検索はてなトップ
8.このページを友達に紹介
9.このページの先頭へ
対応機種一覧
お問い合わせ
ヘルプ/お知らせ
ログイン
無料ユーザー登録
はてなトップ