PHPで文字コード変換時にHTMLタグが変換されない方法を教えて下さい。

Question

kbkb

15

15もっと見る

80pt

ウェブ制作

PHPで文字コード変換時にHTMLタグが変換されない方法を教えて下さい。

調査時間が不足しているため質問いたします。

$str = "<学校>URL"; //utf-8
$str = mb_convert_encoding($str, "sjis", "utf-8");
print $str; // <学校>URLになる

shift_jisでprintした際にutf-8の時と同じ文字列で表示をしたいのです。

回答の条件

1人2回まで

登録：2010/10/20 02:40:46
終了：2010/10/20 19:52:19

※ 有料アンケート・ポイント付き質問機能は2023年2月28日に終了しました。

rouge_2008 2010/10/20 04:21:55

次の文字列が表示されればいいのですか？

<学校>URL

ブラウザに表示した場合、HTMLタグはブラウザによって解釈されるので、上記のようには表示されませんが、HTMLタグが変換されているわけではありません。
今のままでも元の文字列とほぼ同じはずです。
ブラウザでHTMLソースを表示して確認してみてください。
rouge_2008 2010/10/20 08:41:54

mb_convert_encoding()でHTMLタグが変換されるという事はありません。
上でもコメントしましたが、ブラウザでHTMLソースを確認してみてください。
ご存知だと思いますが、「<」が「<」、「>」が「>」で表示されるのもブラウザで表示しているからです。
文字コード変換前の文字列をブラウザ表示して確認してみてください。
Galapagos 2010/10/20 13:28:11

ソースがSJISなのでしたら
$str = "<学校>URL"; //utf-8
もSJISになってしまい、
$str = mb_convert_encoding($str, "sjis", "utf-8");
の動作がおかしなことになってしまいますよ。

「あの人に答えてほしい」「この質問はあの人が答えられそう」というときに、回答リクエストを送ってみてましょう。

これ以上回答リクエストを送信することはできません。制限について

リクエスト送信済

回答リクエストを送信したユーザーはいません

Galapagos · Answer 1 · 2010-10-20T07:32:13+09:00

ご質問のソースで変換されるはずですが、ソースをUTF-8で保存していますか？

ご確認ください。

念のため、mb_internal_encodingを加えたものを下記にしまします。

<?php
mb_internal_encoding('UTF-8');
$str = "&lt;学校&gt;<span style=\"color:#FF0000;\">URL</span>"; //utf-8
$str = mb_convert_encoding($str, 'SJIS', 'UTF-8');
print $str;
?>

y-kawaz · Answer 2 · 2010-10-20T11:28:07+09:00

そのコードでそのような変換がされるとは思えないのですが…。こちらでも実際に試してみましたが出力された文字列は以下の通りでした。

&lt;学校&gt;<span style=\"color:#FF0000;\">URL</span>

僕は質問者さんが何か変な環境でファイルを作っていて < で入力したつもりが実は < で保存されている可能性を疑ってるのですが、それは無いと仮定すると何か環境依存の問題があるのでしょう。

いくつか可能性がありそうなところを検討してみましたが、思い当たる節は今のところありません。

・mb_convert_encoding で指定できるエンコーディングには特殊なものとして "BASE64" とか "HTML-ENTITIES" とかあるのでそれらの何かが "sjis" のエイリアスとして設定されていると仮定するとこの現象が起こりうるのか？と思いましたが、僕の調べた範囲では指定できるエンコーディングにはHTMLエスケープするものはあっても逆は無さそうでした（fromのutf-8を指定している側にHTML-ENTITIESを指定したらエスケープになるんですがその場合「学校」の部分が文字化けしてしまうようですし…）

・phpでは < を出力しているが、Apache側でそれを < に変換するようなフィルタが設定されている？ただそんなフィルタは標準では無く自分で作らないとありえないし、そもそもセキュリティ的にも考えにくいのでこれも無いか…

とりあえずブラウザ確認ではなく、サーバ上で手で php test.php といった感じに実行してみたらどうなるか確認してみてはいかがでしょうか？

bayan · Answer 3 · 2010-10-20T13:45:38+09:00

文字コードの変換をせずUTF-8のままだと期待通り表示されるということでしょうか?

> を < を見たまんま表示したいとことでしたら

htmlspecialchars にかけてはどうでしょうか?

print htmlspecialchars($str);

PHPで文字コード変換時にHTMLタグが変換されない方法を教えて下さい。

回答（3件）

Galapagos963892010/10/20 07:32:13

y-kawaz14222262010/10/20 11:28:07

bayan100132010/10/20 13:45:38

コメント（3件)

この質問への反応（ブックマークコメント）