UTF-8の各文字による消費バイト数の表とかありませんか?

だいたいASCIIは1byte、全角文字は2byte、半角カタカナは3byteのようですが、全角文字でも3byte消費するものがあるようです。うむう。

回答の条件
  • URL必須
  • 1人2回まで
  • 登録:2005/05/03 01:52:24
  • 終了:--

回答(2件)

id:jouno No.1

jouno回答回数280ベストアンサー獲得回数02005/05/03 02:28:29

ポイント35pt

こういうことです。

0x0000~0x007F が1

0x0080~0x07FF が2

0x0800~0xFFFF が3バイトです。

大体の分布はページのいちばん下に。

http://www.kishugiken.co.jp/cn/code06c.html

紀州技研工業・文字コードの話/ユニコード表

具体的にはこの表でその文字のユニコードのコード番号がわかります。

id:fslasht

回答ありがとうございます。

 よくわかりました。

2005/05/03 02:38:46
id:Kumappus No.2

くまっぷす回答回数3784ベストアンサー獲得回数1852005/05/03 02:34:16

ポイント35pt

http://www-1.ibm.com/support/docview.wss?uid=std3156b13ecba020ba...

IBM - DB2: UTF-8の日本語DBCSのバイト長

いえ、全角もたいてい3バイトみたいですよ。

半角カタカナについては3バイトですね。

id:fslasht

回答ありがとうございます。

 どうやら我々は大変な思い違いを(以下略)

 な、なんだっ(以下略)

2005/05/03 02:40:27

コメントはまだありません

この質問への反応(ブックマークコメント)

トラックバック

「あの人に答えてほしい」「この質問はあの人が答えられそう」というときに、回答リクエストを送ってみてましょう。

これ以上回答リクエストを送信することはできません。制限について

絞り込み :
はてなココの「ともだち」を表示します。
回答リクエストを送信したユーザーはいません