人力検索はてな
モバイル版を表示しています。PC版はこちら
i-mobile

今「日本語と中国語の自動翻訳」の研究をしています。日本語を自動的に入力するため、「UTF-8漢字コード」を使っています。(参考サイト:http://charset.7jp.net/jis0208.html) 同じような「中国語漢字コード表」がないでしょうか。(中国語の漢字に対応するUTF-8コード表)
よろしくお願いします。

●質問者: Ganan
●カテゴリ:コンピュータ
✍キーワード:UTF-8 コード サイト 中国語 入力
○ 状態 :終了
└ 回答数 : 2/2件

▽最新の回答へ

1 ● Reiaru
●35ポイント

UTF-8 (Unicode) と考えますと、以下で宜しいでしょうか。


Chinese Character Codes

Unicode Character Map, 0x4E00 - 0x4FFF

Unicode Character Map, 0x5000 - 0x5FFF

Unicode Character Map, 0x6000 - 0x6FFF

Unicode Character Map, 0x7000 - 0x7FFF

Unicode Character Map, 0x8000 - 0x8FFF

Unicode Character Map, 0x9000 - 0x9FFF


上記はリンク先が分かれているのが難点です。これでも実用面では問題無さそうだとは思うのですが、より完全なものが以下にあります。


CJK Unified Ideographs Range: 4E00-9FCF The Unicode Standard, Version 5.2.

http://unicode.org/charts/PDF/U4E00.pdf


但し、アクセスする際には注意して下さい。全 609 ページ、33 MB もある PDF ファイルです。

非常に重たいどころの騒ぎではない様な PDF ですので、それを覚悟した上の閲覧をお願いします。

(直接アクセスではなく、一度対象をローカルに保存してから閲覧した方が宜しいかと)

◎質問者からの返答

大変参考になりました。どうもありがとうございます。


2 ● ardarim
●35ポイント

Unicodeとの変換表であれば、unicode.orgから入手できます。

big5 ←→ UTF-16(BIG5=台湾・香港等の繁体系中国語文字コード)

CN11643 ←→ UTF-16(CN11643=大陸の簡体系中国語文字コード)

テキストファイルなのでプログラムからの利用が容易です。


UTF-16からUTF-8は機械的な簡単な計算で求められます。(Wikipediaに簡単な解説あり)

UTF-16 (16進表記)UTF-16 (2進表記)UTF-8 (2進表記)
0x00?0x7F000000000xxxxxxx0xxxxxxx
0x80?0x7FF00000xxxxxyyyyyy110xxxxx 10yyyyyy
0x800?0xFFFFxxxxyyyyyyzzzzzz1110xxxx 10yyyyyy 10zzzzzz


なければ作る、がモットーなので(えー)作ってみました。

どうでしょう?

Big5 to Unicode table

CNS11643 to Unicode table

関連質問


●質問をもっと探す●



0.人力検索はてなトップ
8.このページを友達に紹介
9.このページの先頭へ
対応機種一覧
お問い合わせ
ヘルプ/お知らせ
ログイン
無料ユーザー登録
はてなトップ