人力検索はてな
モバイル版を表示しています。PC版はこちら
i-mobile

OKWaveとHatenaで自分が質問した、回答した全てのデータを取り出して保存したいと思います。取り出し手段はExcel,Word,UWSC,何らかのマクロ、なんでも結構なので実現可能な方法を教えてください。

●質問者: popattack
●カテゴリ:コンピュータ インターネット
✍キーワード:Excel Hatena OKWave UWSC Word
○ 状態 :終了
└ 回答数 : 2/4件

▽最新の回答へ

1 ● esecua
●35ポイント

フォーマットですが、PDFでも構わないですか?


もしよろしければ以下の方法を試してみてください。

http://gigazine.net/index.php?/news/comments/20080116_bullzip_pd...

簡単に言えばフリーのPDF作成ソフトBullZipをインストールし、保存したいはてな又はOKWAVEのサイトをブラウザで表示し、印刷ボタンを押します。印刷の際に先ほどインストールしたBullZipを選択します。

すると表示しているサイトがPDFで表示されますので、それを保存すればOKです。

参考になれば幸いです。

◎質問者からの返答

こんにちは。PDFでも特に大丈夫ですが、これだと例えば100件hatena,OKwaveで質問したとします。それを一発で抽出してExcel,word,pdfへ保存できないですよね?

手で一件ずつ自分がした質問、回答をひらいてWordや秀丸へ貼り付けてとやっていたら大変なので一発か、いくつかの手順をふむだけで実現できたらと思ってます。


2 ● esecua
●35ポイント

すいません、勘違いしていました。

自分がした質問のページ又は指定したページをすべて一括で保存したいということですね。

Office系でIEをキャプチャーし、保存するマクロは聞いたことがないので(単に私が知らないだけかもしれませんが)これを行うには個別にプログラムを書く必要があると思います。


私がよく使用するPHPで行う場合、例えばPCにApacheなどのサーバをインストールし、PHPが走れる環境をつくります。そして例えば、はてぶのようにJavascriptで書いたブックマークレットを作り、後にPDFで保存したいページのURLをMySQLなどのデータベースに保存し、いくつかのURLがたまってきたら別のPHPプログラムにページのURLをfile()などで開かせ、正規表現などで指定したHTML内のコンテンツを抜き取り、そしてPDFで変換、保存を繰り返させます。


ただ、この場合注意があります。例えばはてな内で指定した1000ページを短時間にアクセスさせ保存しようとすると、はてなのサーバに高負荷を与えかねません。そうなると営業妨害ともなり大変なことになってしまいます。プログラム内で一定時間にアクセスする回数と、1回での実行によるページ数を設定しておいた方がいいと思います。これは一種のクローラなので、相手のサイトに負荷をかけないように配慮する必要があります。

参考になれば幸いです。

http://itpro.nikkeibp.co.jp/article/COLUMN/20070305/263861/

関連質問


●質問をもっと探す●



0.人力検索はてなトップ
8.このページを友達に紹介
9.このページの先頭へ
対応機種一覧
お問い合わせ
ヘルプ/お知らせ
ログイン
無料ユーザー登録
はてなトップ