人力検索はてな
モバイル版を表示しています。PC版はこちら
i-mobile

開発環境はVC++6です。UTF-8、EUC、JISなど、できるだけ多くの文字に対応する文字コード判定処理のDLLなどを探しています。どなたか掲載しているHPなど教えていただきたくよろしくお願いします。

●質問者: harunoharuno
●カテゴリ:コンピュータ インターネット
✍キーワード:DLL EUC Hp JIS UTF-8
○ 状態 :終了
└ 回答数 : 1/1件

▽最新の回答へ

1 ● ardarim
●60ポイント

nkf.exe nkf32.dll Windows用

いちおう定番というか老舗というかunix時代から続く息の長いライブラリですね。

ソースコード付きなので、その気があればどうやって判定しているのかも勉強できます。


IEのコンポーネントの一部(mlang.dll)を使うこともできます。この場合、IEが行っている文字コードの自動判別の機能をそのまま利用できます。IMultiLanguage2::DetectInputCodepage()というメソッドです。

ここにGetEncodingInfo()という呼び出し方のサンプルがあります。


実は私は自作のでやっていますが、結構うまくいっているようです。EUC(J)、シフトJIS、JIS7、UTF-8それぞれの符号化方式を熟知する必要がありますが、それぞれの方式で特徴的なバイトシーケンスは加点、ありえないバイトシーケンスは減点という具合で、適当なサイズ分の得点を総合して判定します。

こういうのは自分でちゃんと理解して、うまく動くと面白いものです。余裕があればぜひ挑戦してみては?

◎質問者からの返答

いつも教えていただきありがとうございます。

便利なDLLとかも結構あるんですねー。

とりあえず、文字コード判定が可能なことが解りちょっとほっとしました。

自作の判定処理は、別の質問で教えていただいたリンク

http://kasumi.sakura.ne.jp/~gm/gpj/dev/tips/other/kanji.shtml

を元に作成中・・・。

やっぱ、できるものなら

自分で理解して作れた方が楽しいし、後々改造もしやすいので

もう少し頑張ってみることにします。

関連質問


●質問をもっと探す●



0.人力検索はてなトップ
8.このページを友達に紹介
9.このページの先頭へ
対応機種一覧
お問い合わせ
ヘルプ/お知らせ
ログイン
無料ユーザー登録
はてなトップ