PHP 指定したサイトの<body>以下からのHTMLタグを抜き取った2000文字を取得する function をPHPで書いてください。


あと、たまに <body のほかに <body topmargin="0" leftmargin="0">な感じで body 以外にもいろいろ入っているサイトもあるのでそのようなサイトにも対応できるようにお願いします。

回答の条件
  • 1人3回まで
  • 登録:
  • 終了:2006/05/25 09:28:11
※ 有料アンケート・ポイント付き質問機能は2023年2月28日に終了しました。

ベストアンサー

id:ctrl-v No.1

回答回数289ベストアンサー獲得回数15

ポイント38pt

$url = "http://www.hatena.ne.jp";//指定のURL

get2000($url);

function get2000($url){

$data = file_get_contents($url);

$data = trim($data);

$data = str_replace("\r","",$data);//改行除去

$data = str_replace("\n","",$data);//改行除去

$data = strip_tags($data);//タグ除去

$data = substr($data,0,4000);//全角で2000文字

echo $data;

}

id:esecua

ありがとうございます。これでOKです。

2006/05/25 09:25:53

その他の回答1件)

id:ctrl-v No.1

回答回数289ベストアンサー獲得回数15ここでベストアンサー

ポイント38pt

$url = "http://www.hatena.ne.jp";//指定のURL

get2000($url);

function get2000($url){

$data = file_get_contents($url);

$data = trim($data);

$data = str_replace("\r","",$data);//改行除去

$data = str_replace("\n","",$data);//改行除去

$data = strip_tags($data);//タグ除去

$data = substr($data,0,4000);//全角で2000文字

echo $data;

}

id:esecua

ありがとうございます。これでOKです。

2006/05/25 09:25:53
id:punky99 No.2

回答回数30ベストアンサー獲得回数1

ポイント32pt

何の捻りもなくベタに書いてみましたが、、、、

最後の2行が呼び出し/表示です。抜き出す文字数は、引数$countで指定するようにしてみました。

http://site-punky.net/misc/strip_body.txt

PHP5ならstripos()という関数でもうちょっとラクが出来そうなのですが、使わずに書いてみました。

HTMLのタグは、strip_tags()という関数で取り除くことができます。

id:esecua

ありがとうございます。

2006/05/25 09:27:15

コメントはまだありません

この質問への反応(ブックマークコメント)

トラックバック

  • PHP で HTMl テキスト 取得 インパクトを受けたときに書く日記 2006-06-04 03:04:50
    数日前の課題 IPアドレスがズラット並んだサイトがあってそこの IPアドレスを配列に格納するように言われた。 幸いIPアドレスは で囲まれていたからsplitを使えばすぐに取れた。
「あの人に答えてほしい」「この質問はあの人が答えられそう」というときに、回答リクエストを送ってみてましょう。

これ以上回答リクエストを送信することはできません。制限について

回答リクエストを送信したユーザーはいません