人力検索はてなで、自分の知らない分野の質問・回答をみていると、自分の知らない単語が話されています。そんな中で、一番印象にのこったのはなんでしょう。
今はわかるようになったのも、今でもわからないのもあり。
(ただし、「はてな」のシステムにかかわる語-たとえば、「いわし」「いるか」-は除きます)
記載されていたアドレス見てきました。
質問文も回答文もさっぱりわかりません(苦笑)
なお、
utf-8自体は、文字コードだと思います。
例えばはてなのページの場合文字コードを示す部分が
<meta http-equiv="content-type" content="text/html; charset=utf-8">
と書いてあります。
utf-8の部分がShift_JISだったりEUCだったりすることもあると思います。
例えば、このページをシフトjisで読んだりするとめちゃくちゃになります。(わけのわからない漢字だらけとか)
文字コードってどう説明したらわかりやすいでしょうか・・・。
私達がパソコンで文字を打っている時って、
日本語で文章を打っているつもりであっても、パソコンの中では(おそらく)数字や記号での羅列だと思うんです。
そして、パソコンなどにある変換装置を使うことによって、それが日本語(或いは意味の通じる文章)になっているのだと思います。
WEBページを作る側の環境によっては、
シフトJISという名前の変換装置、utf-8という名前の変換装置を使って読める文章にしているか、異なってくると思います。
そして
<meta http-equiv="content-type" content="text/html; charset=utf-8">
は、このページはutf-8という変換装置を使っていますよ、ということをローカルにあるパソコンのブラウザ(インターネット閲覧のソフト)にわからせ、それを実行させるための命令で、
その命令を自動的に判読して、ブラウザは、utf-8で書かれたページはutf-8で、シフトJISで書かれたページはシフトJISで読むようになるため、
閲覧者は意味の通じる文章として認識できているのではないかと思います。
逆に上記の命令が不充分だと(一部に間違いがあったりすると)文字化けしたり(=わけのわからない文字の羅列になること)ページが真っ白になったりします。
わざと命令と異なる文字コードでページを表示しようとしても似たような現象が起こります。
でも「文字コード」に関する認識がこれで合っているかどうかわかりません。
(Wikiで文字コードのページ見ましたがかえって、さっぱりわからなくなりました・・・。もっと機械オンチにもわかるように一般的に書いてくれ!<Wiki編集者の方)
http://q.hatena.ne.jp/1172712176
なんのとこやらチンプンカンプンです。