人力検索はてな
モバイル版を表示しています。PC版はこちら
i-mobile

あるはてなダイアリーの全ての記事のそれぞれの最初の50字くらいを、取得してHPに載せる、ということは可能でしょうか?
そのブログのRSSを取得して…という感じになるのでしょうか?
ただ少し、自分でやってみたところ、RSSでは最初の5件までしかデータが入っていないようなのですが…。
よろしくお願いします。

●質問者: rapuntuleru
●カテゴリ:コンピュータ インターネット
✍キーワード:Hp RSS はてなダイアリー データ
○ 状態 :終了
└ 回答数 : 4/4件

▽最新の回答へ

1 ● itss
●23ポイント

Hi,

>RSSでは最初の5件までしかデータが入っていないようなのですが…。

どういう手法で取得してるんでしょうか?

取得できますよ。

◎質問者からの返答

回答ありがとうございます。

一応

http://www.hyuki.com/yukiwiki/wiki.cgi?MagpieRSS

を参考に、ブログのアドレス/rss から取ってきました。


2 ● pahoo
●23ポイント

可能です。


はてなダイアリーの場合、

http://d.hatena.ne.jp/hogehoge/yyyymmdd/

に1日分のコンテンツが入っています。まず、このコンテンツを分析し、冒頭のみ抽出します。

Perlであれば、下記のようなモジュールにが役立つでしょう。


この1日分のページの最後に、「前の日」というキーワードがあります。このリンク先が前日のコンテンツですから、このチェーンをたどっていけば、ダイアリーの最初のページまでたどり着くことができます。

「前の日」の前後には特徴的なタグが並んでいるので、コンテンツ中から抽出することは、さほど難しくないと思います。


なお、ブログの記事は著作物です。その一部を切り出し引用する際は、著作者の許可を得てから行いましょう。


参考サイト

◎質問者からの返答

回答ありがとうございます。

Perlですかぁ…。できればPHPかJavaかJavaScript(JavaScriptのみでは無理なんですよね…?)

で実装したいのですが。。。


3 ● pahoo
●22ポイント

できればPHPかJavaかJavaScript(JavaScriptのみでは無理なんですよね…?)で実装したいのですが。。。

PHPやJavaでもできますよ。

たとえばPHPなら、「PHPで住所から緯度経度を求める」で、MapFanのサイトを解析して住所から緯度/経度を求めるスクリプトを紹介しています。


JavaScriptでもできないことはありません。IE限定になりますが、document.all で、いまアクセスしているHTMLを参照できますので。


いずれのアルゴリズムも#2に述べたものと同じです。

◎質問者からの返答

回答ありがとうございます。

すみません。プログラミング(特に通信を扱ったもの)初心者なので、少しピンと来ない

ところがあるのですが…。

例えば上のようなプログラムの処理は該当のhtmlをそのまま取得してそれを解析しているのでしょうか?


4 ● sterwars22
●22ポイント

phpのマッチング部分はperl互換なので、同じです。

関連質問


●質問をもっと探す●



0.人力検索はてなトップ
8.このページを友達に紹介
9.このページの先頭へ
対応機種一覧
お問い合わせ
ヘルプ/お知らせ
ログイン
無料ユーザー登録
はてなトップ