人力検索はてな
モバイル版を表示しています。PC版はこちら
i-mobile

PHP

file_get_contents("http://yahoo.com") で取得したWebページHTMLソースコードから、ブラウザ側に表示される文字列だけを表示するにはどうすればいいでしょうか?

echo strip_tags(file_get_contents("http://yaho.ocm"));

だと、Javascriptの部分が紛れ込んでしまいます。

●質問者: webtomake
●カテゴリ:ウェブ制作
○ 状態 :終了
└ 回答数 : 2/2件

▽最新の回答へ

1 ● LLマン
●50ポイント ベストアンサー
<?php
// JavaScript / styleタグ除去

$html = '<style type="text/css">test1</style>test2<script type="text/javascript">test3</script>test4';

$html = preg_replace('!<script.*?>.*?</script.*?>!is', '', $html);
$html = preg_replace('!<style.*?>.*?</style.*?>!is', '', $html);

echo $html;
?>

上記がJavaScript(とCSS)のタグを除去するPHPコードのサンプルになります。
オンラインコードサービスですが、一応動作を確認しました。


2 ● easygoings
●50ポイント
<?php
$html = file_get_contents("http://www.yahoo.co.jp/");
$html = preg_replace('!<script.*?>.*?</script.*?>!is', '', $html);
$html = preg_replace('!<style.*?>.*?</style.*?>!is', '', $html);
echo strip_tags($html);

javascriptやCSSに対応してない(除去している)ので、
当然ながら、javascriptやCSSに対応したブラウザと表示は変わってしまいますが。

関連質問

●質問をもっと探す●



0.人力検索はてなトップ
8.このページを友達に紹介
9.このページの先頭へ
対応機種一覧
お問い合わせ
ヘルプ/お知らせ
ログイン
無料ユーザー登録
はてなトップ