UTF-8の各文字による消費バイト数の表とかありませんか?

だいたいASCIIは1byte、全角文字は2byte、半角カタカナは3byteのようですが、全角文字でも3byte消費するものがあるようです。うむう。

回答の条件
  • URL必須
  • 1人2回まで
  • 登録:
  • 終了:--
※ 有料アンケート・ポイント付き質問機能は2023年2月28日に終了しました。

回答2件)

id:jouno No.1

回答回数280ベストアンサー獲得回数0

ポイント35pt

こういうことです。

0x0000~0x007F が1

0x0080~0x07FF が2

0x0800~0xFFFF が3バイトです。

大体の分布はページのいちばん下に。

http://www.kishugiken.co.jp/cn/code06c.html

紀州技研工業・文字コードの話/ユニコード表

具体的にはこの表でその文字のユニコードのコード番号がわかります。

id:fslasht

回答ありがとうございます。

 よくわかりました。

2005/05/03 02:38:46
id:Kumappus No.2

回答回数3784ベストアンサー獲得回数185

ポイント35pt

http://www-1.ibm.com/support/docview.wss?uid=std3156b13ecba020ba...

IBM - DB2: UTF-8の日本語DBCSのバイト長

いえ、全角もたいてい3バイトみたいですよ。

半角カタカナについては3バイトですね。

id:fslasht

回答ありがとうございます。

 どうやら我々は大変な思い違いを(以下略)

 な、なんだっ(以下略)

2005/05/03 02:40:27

コメントはまだありません

この質問への反応(ブックマークコメント)

トラックバック

「あの人に答えてほしい」「この質問はあの人が答えられそう」というときに、回答リクエストを送ってみてましょう。

これ以上回答リクエストを送信することはできません。制限について

回答リクエストを送信したユーザーはいません