char型の配列を使って、ファイル入出力するプログラムを作成しています。文字列の切り離し処理が必要なことから、unicodeの設定にして、配列を２バイトに統一したいと思っています。この場合、どういうようにコードを書き換えたら良いのでしょうか？

Question

champclair

87

87もっと見る

70pt

コンピュータ学習・教育

char型の配列を使って、ファイル入出力するプログラムを作成しています。文字列の切り離し処理が必要なことから、unicodeの設定にして、配列を２バイトに統一したいと思っています。この場合、どういうようにコードを書き換えたら良いのでしょうか？

開発環境.NET2003VC++ Windows2000
CやAPI等だけを使って実現したいと思っています。
よろしくお願いします。

回答の条件

1人2回まで

登録：2006/06/19 15:34:59
終了：2006/06/26 15:35:04

※ 有料アンケート・ポイント付き質問機能は2023年2月28日に終了しました。

コメントはまだありません

「あの人に答えてほしい」「この質問はあの人が答えられそう」というときに、回答リクエストを送ってみてましょう。

これ以上回答リクエストを送信することはできません。制限について

リクエスト送信済

回答リクエストを送信したユーザーはいません

mzk · Answer 1 · 2006-06-19T16:12:32+09:00

WinAPIの文字コードはどちらを使うか悩むところが結構あったりしますが、プログラムの処理に直結するような部分の文字コードは、char(CHAR)型やwchar_t(WCHAR)型を使い、そうでもない（たとえばメッセージボックスに渡す文字列型など）はTCHARやLPTSTR,PTCHARなどを使うようにすれば良いと思います。

CHARやWCHARは前者から1バイトと2バイトと固定ですが、TCHARなどは「#define UNICODE」が宣言されていれば2バイト。違えば1バイトになります。

それとAPI関数に文字列を渡す場合はMessageBoxの実体は、ShiftJIS用がMessageBoxA()。Unicode用がMessageBoxW()です。

文字列を扱う関数の全てがこのような仕様ですが、MessageBoxWは9x系には標準装備されてなかったはずですので注意が必要です。

文字列定数に関しては以下のような感じになります。

wsprintfA(buf, "test"); // シングルバイト

wsprintfW(buf, __T("test")); // ダブルバイト

wsprintf(buf, TEXT("test"); // UNICODE宣言により変わる

ohmix1 · Answer 2 · 2006-06-19T17:53:50+09:00

>文字列の切り離し処理が必要なことから、

>unicodeの設定にして

↑この関係がわかりませんが、とりあえず分かることを書きます。

まず、マニュアルはこのあたりです。

http://msdn2.microsoft.com/ja-jp/library/5z097dxa.aspx

簡単に書くと、MBCSでは

char c = 'c';

const char* szMsg = "message";

printf("CHAR=%c MSG=%s\n", c, szMsg);

と書いているのをUNICODEでは

wchar_t c = L'c';

const wchar_t* szMsg = L"message";

wprintf(L"MSG=%s\n", szMsg);

と書きます。これだとMBCSとUNICODEを明確に意識してプログラムしないといけないので、

VC++ではどちらでもコンパイルできるように、

TCHAR c = TCHAR('c');

LPCTSTR szMsg = _T("message");

_tprintf(_T("MSG=%s\n"), szMsg);

と書くことができます。

つまり、WindowsAPI、Cランタイム関数、char型には

・MBCS版

・UNICODE版

・どちらでもコンパイルできるラッパー定義

が存在します。通常はどちらでもコンパイルできるように書いておくのが無難ですが、完全に正しく動くかどうかは微妙です。

なお、

・Windows9xではUNICODE系のAPIはありません。

・そのように書いてしまうとUnixへ移植しにくくなるります。

以上

ma-kanoh · Answer 3 · 2006-06-19T22:07:31+09:00

http://ja.wikipedia.org/wiki/マルチバイト文字

まず、WindowsのAPI、Win32APIを使用する場合は

・マルチバイト(Unicode文字集合==常に2バイト。utf16と同じ意味)

・ワイド文字(utf8文字集合==1～4バイト可変)

のどちらを使うか決めなければいけません。

で、マルチバイトを使うならば、ぜーんぶ2バイトです。

ASCII文字に見えても、そのように見てはいけません。

、、んん、でもないか。ASCIIだと分かりきっていればそれでも

いいです。

混ぜるな危険ってやつですが。

>char型の配列

とありますが、マルチバイト文字は、あくまで「マルチバイト」

の「文字型」とと考えたほうが身のためです。

一応、「MBCS」となってますがあまり信頼しすぎると、

変な動作をしだします。

http://msdn2.microsoft.com/ja-jp/library/zz3x65c7.aspx

も一応、挙げておきます。

>。この場合、どういうようにコードを書き換えたら良い

は、まず「マルチバイト」か「ワイド文字」かどちらか決定して

からです。使う関数が体系で分かれてますので。

回答（3件）

mzk199142006/06/19 16:12:32

ohmix1235142006/06/19 17:53:50

ma-kanoh15542006/06/19 22:07:31

コメント（0件)

この質問への反応（ブックマークコメント）