文字コードは前回の質問のようにEUCです。UTF-8に変更したいのですが、文字コードをどっちにしても、それぞれ一長一短であると聞きました。それぞれの長所と短所を教えてください。
なお、使っているパソコンとブラウザは
Windows(IE,Firefox,ネスケ)
Mac(IE,Safari,Firefox)
になります。
文字コードによっては特定のブラウザで文字化けするというブラウザもあると聞きましたが、本当でしょうか。
長文で申し訳ありません。よろしくおねがいいたします。
EUCの場合は日本語専用で、日本語は常に2バイト文字になります(これはUTF-16も同じですが)。日本語専用なので他の国のマルチバイト文字とは混用できません。
UTF-8の場合は可変長なので1バイト目を見て文字の長さを判断する必要があるのでやや処理が煩雑になります。ただし、多国語を同じテキストの中に混用することができます。
http://palm.mo-blog.jp/blog/2005/01/post_5.html
taichi :: palm blog: ブラウザの問題点
以前は対応していないブラウザや環境が多かったです。例えばLinux環境がUTF対応し始めたのはここ1,2年のことです。今でもLinuxの標準的な日本語端末ktermはUTF対応していないはずです。XMLが普及し始めたのでだんだんそういうことはなくなっていくでしょうが。
http://www.securehtml.jp/utf-8/
ブラウザ・メールソフト別UTF-8対応状況
現在、一般的に用いられているブラウザで、UTF-8に対応していないブラウザはありません。これはWindows、Macでも同様です。Linux版のブラウザ(Firefox、Netscape、Opera)でも同様です。
「○の中に数字が入ったもの」や「『(株)』が一文字になったもの」などは機種依存文字と言いますが、機種依存文字をWindows・Macとも正しく表現するためには、UTF-8でなければなりません。Shift_JISやEUC-JPではMacでは正しく表現されなかったりします。
ありがとうございました。とてもよくわかりました。
ありがとうございます。できれば、両方のメリット・デメリットを教えて頂けますとありがたいです。
http://shimax.cocolog-nifty.com/search/2005/01/macie.html
WEBプログラミング NOW!: Mac版IE+ココログのコメント・文字化け
2回目です。先ほどはUTF-8のメリットだけを書きましたが、デメリットを付け加えさせていただきます。
対策はあるのですが、UTF-8の場合、Mac版IE5.2.3でtextarea内に文字を入力仕様とした場合、文字化けします。対策として、ユーザーに正しくフォント設定をしてもらうか、BLOG提供者の方がスタイルシートでMac版IE5.2.3でも文字化けしないようにする必要があります。もちろん、後者の解法の方がbetterです。
ただし、あくまでもコメント入力欄などのtextarea内の話であり、Mac版IE5.2.3でもformタグの外側の本文などはいずれにしても影響は受けませんので、文字化けしたりはしません。
ありがとうございます。
ありがとうございます。多国語混じりでも使えるというのに感激しました。