具体的には、こちらが指定するURL(ファイルで10000個くらい所有)すべてにアクセスして一部分の文章を持ってきたいと考えています。
HTMLパーサー?的なことができる方法やサイトを教えて下さい。
Wgetとしてこのタグとこのタグの間を抜くという方法が一番現実的なのでしょうか・・・。
http://program.g.hatena.ne.jp/kuippa/
プログラマの秘密のあれこれ - マじん。くいっぱ
ちょうど一昨日PHPでそんなような目的の関数をつくってたので。
文章を一部もってくるのは特定のパターンをもっていますか?持ってくるURLは関数の引数あたりにしてやればできると思いますし。
やりようは多くあると思います。
ありがとうございます。
正規表現を使って、抜くパターンですね。