OKWaveとHatenaで自分が質問した、回答した全てのデータを取り出して保存したいと思います。取り出し手段はExcel,Word,UWSC,何らかのマクロ、なんでも結構なので実現可能な方法を教えてください。

回答の条件
  • URL必須
  • 1人2回まで
  • 登録:2008/03/18 03:34:37
  • 終了:2008/03/25 03:35:02

回答(4件)

id:esecua No.1

esecua回答回数510ベストアンサー獲得回数102008/03/18 12:34:32

ポイント35pt

フォーマットですが、PDFでも構わないですか?


もしよろしければ以下の方法を試してみてください。

http://gigazine.net/index.php?/news/comments/20080116_bullzip_pd...

簡単に言えばフリーのPDF作成ソフトBullZipをインストールし、保存したいはてな又はOKWAVEのサイトをブラウザで表示し、印刷ボタンを押します。印刷の際に先ほどインストールしたBullZipを選択します。

すると表示しているサイトがPDFで表示されますので、それを保存すればOKです。

参考になれば幸いです。

id:popattack

こんにちは。PDFでも特に大丈夫ですが、これだと例えば100件hatena,OKwaveで質問したとします。それを一発で抽出してExcel,word,pdfへ保存できないですよね?

手で一件ずつ自分がした質問、回答をひらいてWordや秀丸へ貼り付けてとやっていたら大変なので一発か、いくつかの手順をふむだけで実現できたらと思ってます。

2008/03/18 12:50:56
id:esecua No.2

esecua回答回数510ベストアンサー獲得回数102008/03/18 14:46:29

ポイント35pt

すいません、勘違いしていました。

自分がした質問のページ又は指定したページをすべて一括で保存したいということですね。

Office系でIEをキャプチャーし、保存するマクロは聞いたことがないので(単に私が知らないだけかもしれませんが)これを行うには個別にプログラムを書く必要があると思います。


私がよく使用するPHPで行う場合、例えばPCにApacheなどのサーバをインストールし、PHPが走れる環境をつくります。そして例えば、はてぶのようにJavascriptで書いたブックマークレットを作り、後にPDFで保存したいページのURLをMySQLなどのデータベースに保存し、いくつかのURLがたまってきたら別のPHPプログラムにページのURLをfile()などで開かせ、正規表現などで指定したHTML内のコンテンツを抜き取り、そしてPDFで変換、保存を繰り返させます。


ただ、この場合注意があります。例えばはてな内で指定した1000ページを短時間にアクセスさせ保存しようとすると、はてなのサーバに高負荷を与えかねません。そうなると営業妨害ともなり大変なことになってしまいます。プログラム内で一定時間にアクセスする回数と、1回での実行によるページ数を設定しておいた方がいいと思います。これは一種のクローラなので、相手のサイトに負荷をかけないように配慮する必要があります。

参考になれば幸いです。

http://itpro.nikkeibp.co.jp/article/COLUMN/20070305/263861/

質問者が未読の回答一覧

 回答者回答受取ベストアンサー回答時間
1 evh_y 269 243 7 2008-03-19 10:58:56
2 evh_y 269 243 7 2008-03-19 11:00:13

コメントはまだありません

この質問への反応(ブックマークコメント)

「あの人に答えてほしい」「この質問はあの人が答えられそう」というときに、回答リクエストを送ってみてましょう。

これ以上回答リクエストを送信することはできません。制限について

絞り込み :
はてなココの「ともだち」を表示します。
回答リクエストを送信したユーザーはいません