英語版のHPを作ろうと思い、ふと疑問に思ったのですがアメリカでは文字コードはどんなものになるのでしょうか?
日本の様にSJIS、EUC、UTF-8などで頭を悩ましているアメリカ人のウェブデザイナーさんはいるのでしょうか?
もし、文字コードが何種類かあるならば、一番多く使われている文字コードはなんでしょうか?
どなたかわかる方、教えて下さい。
英語しか使わないなら、文字コードは何でもOKです。ちなみに、アメリカのgoogleはcharset=UTF-8、ヤフーもcharset=UTF-8でした。
文字コードの統計的なことは分かりませんが、英文HPでも最近はUTF-8が多いように思います。(UTF-8はAsciiの上位互換)
http://www.linux.or.jp/JF/JFdocs/Secure-Programs-HOWTO/character...
日本語PCで英語HPを作成して文字化けしやすいのが
1) 全角スペース(知らずに入れてしまう)
2) アポストロフィーやダブルクォーテーション(ワード文書から切り貼りすると文字化けすることがあります)
のあたりです。
さらさらっとUSAのホームページを見たときに、UTF-8とiso-8859-1が多いような感じを受けました。
(1)(2)、両方に気をつけてやりたいと思います。
日本では、(いちばん使われているかどうかは別として)デファクトスタンダードはシフトJISです。これはWindowsで使われている文字コードです。
日本のシフトJISに相当する、アメリカでのコード(Windowsで標準として使われているもの)は、Latin 1 (Codepage 1252)と呼ばれるものです。Internet Explorerのエンコードで選択できるものの中では、「西ヨーロッパ言語 (Windows)」と表示されているものが該当します。
またそれに順ずるものとして、DOS-US (Codepage 437)も使われることがあります。これは、Windowsの前時代であるMS-DOSの時代に、IBM-PCに搭載されていたコードセットであり、MS-DOS時代のデファクトスタンダードと言えます。ただしWindowsが当たり前になった最近では使われることはほとんどないと思います。Internet Explorerのエンコード一覧にもでてきません。
見比べるとわかりますが、通常のアルファベットや数字は基本的に共通ですが、それ以外の記号やアクセント記号付きのアルファベットなどが異なっており、これらの文字などを使った場合は、日本での文字コードと同様、期待した文字が表示されないといったことが起きます。ただし、通常はこれらの記号類がWEB上で使われることは少ないと思われます。(文字化けを避ける意味もあるのでしょう)
そのほかにも、英語圏では結構多くの文字コードが使われており、少しずつ異なるため、やはり記号やアクセント付きアルファベットなどの文字化けの原因となります。
Wikipediaに英語圏での主要な文字コードの比較(文字配置の違い)が詳しく書かれています。
http://en.wikipedia.org/wiki/Western_Latin_character_sets_%28com...
あとは、日本でもそうですが国際化を意識してUTF-8も増えているようです。
詳しい解説、ありがとうございます。
UTF-8が、あんまり深く考えずにできるようなきがします。
UTF-8で行こうと思います。
何も考えずにSーJISにしたら、どうもいけないような気が本能でしてしまいました。