人力検索はてな
モバイル版を表示しています。PC版はこちら
i-mobile

とある英語テキストファイル(日本語一切含まないはずの)を開いたところ
「ゥ Copyright 2002.」
の様な表記がありました。
1文字目の「ゥ」は文字化けの様な気がしますが実際のところどうなんでしょう?
なるべく詳しく知りたいです。
※TeraPad Ver0.88で開きました
※TeraPadにて開くと、Shift-Jis 改行コードはLFとなります
※「ゥ」以外に日本語は含んでいないテキストです
※「ゥ」は半角文字のようです

●質問者: router
●カテゴリ:コンピュータ
✍キーワード:copyright JIS LF TeraPad とある
○ 状態 :終了
└ 回答数 : 5/5件

▽最新の回答へ

1 ● aki73ix
●20ポイント

http://hp.vector.co.jp/authors/VA018679/js_uni.htm

unicode?\

おそらくUNICODE表記のホームページです


Copyright © 2002

のように(c)の特殊記号が日本語環境だと「ゥ」のように化けます


そのページをSHIFT-JISで開いた時とUNICODE(UTF-8)で開いた時を比較してみてください


上のページのようにUNICODEで文字コードの 0xa9は(c)ですが

SHIFTJISではカナ半角のゥになるわけです

◎質問者からの返答

ご回答ありがとうございます。

TeraPadにて文字コード指定読込をしたところ、UTF-8Nで「ゥ」が「c」となりました。

TeraPadには「©」を表示出来ないようなので「©」でなく「c」でしたが。


2 ● workshot
●20ポイント

http://software.nikkeibp.co.jp/software/special/jiscode/nc.html

$BF|7P%=%U%H%&%(%"!!(JJIS$B4A;z%3!<%I(J

よく(C)Copyrightと書いてある(C)の部分©(著作権を表す)特殊文字です。

以下引用(詳細は上記ページで確認してください)。

例えば7ビット・コードのISO/IEC646をベースにした8ビット・コードISO/IEC8859-1(通称Latin-1)では著作権を表すマーク(Cを○で囲んだもの)がある。この文字はシフトJISのコード体系では小さい(半角の)「ゥ」になる。WWWページなどで「Copyrightゥ…」となっている表示は,この理由による文字化けが起こっているのである。

◎質問者からの返答

ご回答ありがとうございます


3 ● nitscape
●20ポイント

http://www.google.co.jp/search?num=100&hl=ja&c2coff=1&am...

Google

「(C)」(ここではカッコつきの3文字で書いてありますが実際は一文字)を示しています。InternetExplorerではエンコードから「西ヨーロッパ言語」を選択すると「(C)」という表示になります。また「日本語」を選択すると「ゥ」(半角)になります。


実際の文字コードとしては16進数でのA9を示しています。LFは16進数で0Aであり同じではありませんが、TeraPadではおそらく認識できない文字をこのように表示しているのだと思います。バイナリエディタで開くとA9となると思います。


このように一文字のASCII文字は文字コードとして00?7Fまでは国際的に共通な文字(a?zや0?9などの文字やLFなど)が定義されています。

しかしそれ以降の80?FFまでは拡張領域として国ごとに独自の文字が定義されています。日本では半角カナなどが定義されています。しかし西欧のASCIIでは半角カナは定義されずほかの文字が割り当てられています。そのため「ウ」などの表示になっています。

◎質問者からの返答

ご回答ありがとうございます


4 ● yoo15x
●20ポイント

http://www.utoronto.ca/webdocs/HTMLdocs/NewHTML/iso_table.html

ISO 8859-1 (Latin-1) Characters List

このページを開いて、ブラウザのエンコードを「日本語 シフトJIS」と「西ヨーロッパ ISO」と

切替えてみてください。

そのとき、「★ 169 a9 &copy;」のようになっている部分の★が「ウ」と「©」に

入れ替わるのがわかると思います。


英語圏の文字と日本語(Shift_JIS) では、ひとつの「文字を表す番号」を別の形の文字が

使うことになってしまったのでこのようなことが起こります。

◎質問者からの返答

ご回答ありがとうございます


5 ● Dubois
●0ポイント

http://www.law.co.jp/jpnic/nicdoc041.htm

Web?R???e???c??m?I???Y  ?S?|?P

該当フォントが無いことによる著作権マーク(○の中にc)の文字化けだと思います。

関連質問


●質問をもっと探す●



0.人力検索はてなトップ
8.このページを友達に紹介
9.このページの先頭へ
対応機種一覧
お問い合わせ
ヘルプ/お知らせ
ログイン
無料ユーザー登録
はてなトップ