今「日本語と中国語の自動翻訳」の研究をしています。日本語を自動的に入力するため、「UTF-8漢字コード」を使っています。(参考サイト:http://charset.7jp.net/jis0208.html) 同じような「中国語漢字コード表」がないでしょうか。(中国語の漢字に対応するUTF-8コード表)

よろしくお願いします。

回答の条件
  • URL必須
  • 1人2回まで
  • 登録:2009/10/14 23:17:14
  • 終了:2009/10/21 23:20:02

回答(2件)

id:Reiaru No.1

Reiaru回答回数152ベストアンサー獲得回数382009/10/15 01:00:37

ポイント35pt

UTF-8 (Unicode) と考えますと、以下で宜しいでしょうか。


Chinese Character Codes

Unicode Character Map, 0x4E00 - 0x4FFF

Unicode Character Map, 0x5000 - 0x5FFF

Unicode Character Map, 0x6000 - 0x6FFF

Unicode Character Map, 0x7000 - 0x7FFF

Unicode Character Map, 0x8000 - 0x8FFF

Unicode Character Map, 0x9000 - 0x9FFF


上記はリンク先が分かれているのが難点です。これでも実用面では問題無さそうだとは思うのですが、より完全なものが以下にあります。


CJK Unified Ideographs Range: 4E00-9FCF The Unicode Standard, Version 5.2.

http://unicode.org/charts/PDF/U4E00.pdf


但し、アクセスする際には注意して下さい。全 609 ページ、33 MB もある PDF ファイルです。

非常に重たいどころの騒ぎではない様な PDF ですので、それを覚悟した上の閲覧をお願いします。

(直接アクセスではなく、一度対象をローカルに保存してから閲覧した方が宜しいかと)

id:Ganan

大変参考になりました。どうもありがとうございます。

2009/10/15 09:02:33
id:ardarim No.2

ardarim回答回数892ベストアンサー獲得回数1422009/10/17 17:12:58

ポイント35pt

Unicodeとの変換表であれば、unicode.orgから入手できます。

big5 ←→ UTF-16(BIG5=台湾・香港等の繁体系中国語文字コード)

CN11643 ←→ UTF-16(CN11643=大陸の簡体系中国語文字コード)

テキストファイルなのでプログラムからの利用が容易です。


UTF-16からUTF-8は機械的な簡単な計算で求められます。(Wikipediaに簡単な解説あり)

UTF-16 (16進表記)UTF-16 (2進表記)UTF-8 (2進表記)
0x00~0x7F000000000xxxxxxx0xxxxxxx
0x80~0x7FF00000xxxxxyyyyyy110xxxxx 10yyyyyy
0x800~0xFFFFxxxxyyyyyyzzzzzz1110xxxx 10yyyyyy 10zzzzzz


なければ作る、がモットーなので(えー)作ってみました。

どうでしょう?

Big5 to Unicode table

CNS11643 to Unicode table

コメントはまだありません

この質問への反応(ブックマークコメント)

「あの人に答えてほしい」「この質問はあの人が答えられそう」というときに、回答リクエストを送ってみてましょう。

これ以上回答リクエストを送信することはできません。制限について

絞り込み :
はてなココの「ともだち」を表示します。
回答リクエストを送信したユーザーはいません