あるはてなダイアリーの全ての記事のそれぞれの最初の50字くらいを、取得してHPに載せる、ということは可能でしょうか?

そのブログのRSSを取得して…という感じになるのでしょうか?
ただ少し、自分でやってみたところ、RSSでは最初の5件までしかデータが入っていないようなのですが…。
よろしくお願いします。

回答の条件
  • 1人5回まで
  • 登録:2008/04/28 19:04:48
  • 終了:2008/05/05 19:05:02

回答(4件)

id:itss No.1

itss回答回数171ベストアンサー獲得回数12008/04/28 20:44:22

ポイント23pt

Hi,

>RSSでは最初の5件までしかデータが入っていないようなのですが…。

どういう手法で取得してるんでしょうか?

取得できますよ。

id:rapuntuleru

回答ありがとうございます。

一応

http://www.hyuki.com/yukiwiki/wiki.cgi?MagpieRSS

を参考に、ブログのアドレス/rss から取ってきました。

2008/04/28 23:52:47
id:pahoo No.2

pahoo回答回数5960ベストアンサー獲得回数6332008/04/28 20:49:15

ポイント23pt

可能です。


はてなダイアリーの場合、

http://d.hatena.ne.jp/hogehoge/yyyymmdd/

に1日分のコンテンツが入っています。まず、このコンテンツを分析し、冒頭のみ抽出します。

Perlであれば、下記のようなモジュールにが役立つでしょう。


この1日分のページの最後に、「前の日」というキーワードがあります。このリンク先が前日のコンテンツですから、このチェーンをたどっていけば、ダイアリーの最初のページまでたどり着くことができます。

「前の日」の前後には特徴的なタグが並んでいるので、コンテンツ中から抽出することは、さほど難しくないと思います。


なお、ブログの記事は著作物です。その一部を切り出し引用する際は、著作者の許可を得てから行いましょう。


参考サイト

id:rapuntuleru

回答ありがとうございます。

Perlですかぁ…。できればPHPかJavaかJavaScript(JavaScriptのみでは無理なんですよね…?)

で実装したいのですが。。。

2008/04/28 23:51:21
id:pahoo No.3

pahoo回答回数5960ベストアンサー獲得回数6332008/04/29 17:01:00

ポイント22pt

できればPHPかJavaかJavaScript(JavaScriptのみでは無理なんですよね…?)で実装したいのですが。。。

PHPやJavaでもできますよ。

たとえばPHPなら、「PHPで住所から緯度経度を求める」で、MapFanのサイトを解析して住所から緯度/経度を求めるスクリプトを紹介しています。


JavaScriptでもできないことはありません。IE限定になりますが、document.all で、いまアクセスしているHTMLを参照できますので。


いずれのアルゴリズムも#2に述べたものと同じです。

id:rapuntuleru

回答ありがとうございます。

すみません。プログラミング(特に通信を扱ったもの)初心者なので、少しピンと来ない

ところがあるのですが…。

例えば上のようなプログラムの処理は該当のhtmlをそのまま取得してそれを解析しているのでしょうか?

2008/04/30 03:17:46
id:sterwars22 No.4

sterwars22回答回数363ベストアンサー獲得回数02008/04/30 03:59:13

ポイント22pt

phpのマッチング部分はperl互換なので、同じです。

コメントはまだありません

この質問への反応(ブックマークコメント)

「あの人に答えてほしい」「この質問はあの人が答えられそう」というときに、回答リクエストを送ってみてましょう。

これ以上回答リクエストを送信することはできません。制限について

絞り込み :
はてなココの「ともだち」を表示します。
回答リクエストを送信したユーザーはいません