人力検索はてな
モバイル版を表示しています。PC版はこちら
i-mobile

UTF-8の各文字による消費バイト数の表とかありませんか?
だいたいASCIIは1byte、全角文字は2byte、半角カタカナは3byteのようですが、全角文字でも3byte消費するものがあるようです。うむう。

●質問者: fslasht
●カテゴリ:コンピュータ
✍キーワード:ASCII UTF-8 カタカナ バイト
○ 状態 :終了
└ 回答数 : 2/2件

▽最新の回答へ

1 ● jouno
●35ポイント

http://nowsmartsoft.or.tv/nws/Japanese/unciode.htm

ユニコード

こういうことです。

0x0000?0x007F が1

0x0080?0x07FF が2

0x0800?0xFFFF が3バイトです。

大体の分布はページのいちばん下に。

http://www.kishugiken.co.jp/cn/code06c.html

紀州技研工業・文字コードの話/ユニコード表

具体的にはこの表でその文字のユニコードのコード番号がわかります。

◎質問者からの返答

回答ありがとうございます。

よくわかりました。


2 ● くまっぷす
●35ポイント

http://www-1.ibm.com/support/docview.wss?uid=std3156b13ecba020ba...

IBM - DB2: UTF-8の日本語DBCSのバイト長

いえ、全角もたいてい3バイトみたいですよ。

http://domifara.lolipop.jp/xo/modules/tinyd1/index.php?id=3

半角カタカナについては3バイトですね。

◎質問者からの返答

回答ありがとうございます。

どうやら我々は大変な思い違いを(以下略)

な、なんだっ(以下略)

関連質問


●質問をもっと探す●



0.人力検索はてなトップ
8.このページを友達に紹介
9.このページの先頭へ
対応機種一覧
お問い合わせ
ヘルプ/お知らせ
ログイン
無料ユーザー登録
はてなトップ