文字コードについての質問です。

韓国語のアプリケーションを作成することになりました。

たとえば、日本語の場合はシフトJIS、中国語の場合は簡体字:GB2312と繁体字:BIG5 という風に、
韓国語のWINDOWSで標準にサポートしているコードについて教えてください。

知りたいのは、マルチバイトコードの範囲です。(シングルコードは各言語共通というのは知っています)
※ユニコードではありませんので、誤解しないでください。

回答の条件
  • URL必須
  • 1人1回まで
  • 登録:2008/10/06 18:42:54
  • 終了:2008/10/07 09:41:49

回答(3件)

id:pahoo No.1

pahoo回答回数5960ベストアンサー獲得回数6332008/10/06 19:33:12

ポイント27pt

韓国語の文字コードは以下の4種類があります。

  1. Wansung
  2. UHC(統合ハングル、拡張Wansung)
  3. Johab
  4. Unicode

WindowsXP/Vista(韓国版)はいずれのコードもサポートしていますが、ここではインターネットでよく用いられるWansung(KS C 5601-1987、euc-kr)について説明します。


KS C 5601は、シフトJISに近いコード体系を持つ2バイト文字セットです。

文字コードは A1A1~ACFE、B0A1~C8FE、CAA1~FDFE あたりに割り当てられています。

詳細は「KS X 1001(KS C 5601) 完成型」を参照ください。


参考サイト

id:Excellio

たとえば、ノートパッドでハングル文字を入力して保存すると、それは、A1A1~ACFE、B0A1~C8FE、CAA1~FDFE

で構成されているということですね。

2008/10/06 21:17:20
id:zzz_1980 No.2

zzz_1980回答回数492ベストアンサー獲得回数642008/10/06 23:34:50

ポイント27pt

Windows95以降XPまで韓国語版OSの内部コードなら、cp949では。

1バイト目81-FE、2バイト目41-5A,61-7A,81-FEが使われています。

id:Excellio

KS C 5601ではないのですか・・・。

2008/10/07 00:22:01
id:keino No.3

keino回答回数204ベストアンサー獲得回数112008/10/07 03:49:35

ポイント26pt

KS C 5601-1987では、ハングル2350文字、ハングル字母94字、漢字4888文字、その他8926文字が定められています。

UHA(Unified Hangul Code)は、全ての現代ハングル(11,172文字)を含むようにWansung Codeを拡張したもので、これがCP949に相当すると思われます。

他に、CP1361というのがあって、Johab(KS C 5861-1992/KS X 1001-1997の付属書で規定されている符号化方式)を採用しています。

使用されるコードは、以下のリンクの「組合型符号化文字集合」の項の末尾を参照してください。

http://suika.fam.cx/~wakaba/-temp/wiki/wiki?KS%20C%205601

UHAの拡張部分は実際には使用されることが少なかったみたいですが、韓国でUnicode 2.0対応が進むと使用される可能性があることを考慮に入れた方がいいと思います。

http://www2d.biglobe.ne.jp/~kmlabs/ehc/gairon.html

id:Excellio

なるほど、ハングルというのはいろいろあるんですね。

2008/10/07 09:41:42

コメントはまだありません

この質問への反応(ブックマークコメント)

「あの人に答えてほしい」「この質問はあの人が答えられそう」というときに、回答リクエストを送ってみてましょう。

これ以上回答リクエストを送信することはできません。制限について

絞り込み :
はてなココの「ともだち」を表示します。
回答リクエストを送信したユーザーはいません