今度、日本語のWebサイト(この「はてな」のようなサイト)を
中国語に対応する必要がでてきました。
サイトを構築するにあたり、以下の項目がわかりませんのでおしえていただけますでしょうか。
1.Webアプリが稼働するサーバーのOSは中国語版でなくてはならない?
2.同様に、DBMSやWebサーバーソフトなどのミドルウェアも中国語版でなくてはならない?
3.データベースに中国語を格納する場合、文字コードは何にどうすればよい?
4.データベースに英語、日本語、中国語の混在は可能?
5.中国語の文字コードのバイト数は?
6.そもそも中国語を入力するには、何のソフトを使えばよい?OSを中国語版にすれば、中国語入力ソフトがついてくる?
その他に注意しておかなければならないことがあったら教えて下さい。
)1.Webアプリが稼働するサーバーのOSは中国語版でなくてはならない?
そうでなくても良いですが、そのほうが良いと思います。
中国語を日本語に置き換えて考えてみればよくわかると思いますよ。
サーバーOSは英語版でも日本語WEBサイトを構築可能です。
)2.同様に、DBMSやWebサーバーソフトなどのミドルウェアも中国語版でなくてはならない?
なるべくその方が良いです。
たとえば日本語だとDBMSを選択するばあい、英語版だと文字化けしたりうまく行かなかったりします。
文字コードにUTF-8やUnicodeを用いてもです。
だからなるべく、中国版を使ったほうが良いです。
ミドルウェアでも文字に依存しないものは、どちらでも良いです。
)3.データベースに中国語を格納する場合、文字コードは何にどうすればよい?
UTF-8
Unicodeでも可能だと思いますが、4との関連もあるので避けたほうが良いでしょう。
Unicodeの場合、似たような漢字は同じコードに割り当てられてるという恐ろしい事実があります。
)4.データベースに英語、日本語、中国語の混在は可能?
UTF-8なら可能です。
)5.中国語の文字コードのバイト数は?
バイト数に依存する処理はお勧めできません。
)6.そもそも中国語を入力するには、何のソフトを使えばよい?OSを中国語版にすれば、中国語入力ソフトがついてくる?
日本語入力と似た仕組みで入力可能です。
1.Webアプリが稼働するサーバーのOSは中国語版でなくてはならない?
そんな必要はありません。
2.同様に、DBMSやWebサーバーソフトなどのミドルウェアも中国語版でなくてはならない?
Unicodeに対応していれば問題ありません。
3.データベースに中国語を格納する場合、文字コードは何にどうすればよい?
Unicodeにしてください。
4.データベースに英語、日本語、中国語の混在は可能?
Unicodeなら何語でも大丈夫です。私の設置しているブログの記事には英中日の文字がすべて入っていますが、何の問題もありません。
5.中国語の文字コードのバイト数は?
Unicodeに準じます。
6.そもそも中国語を入力するには、何のソフトを使えばよい?OSを中国語版にすれば、中国語入力ソフトがついてくる?
日本語版Windowsでも「地域と言語のオプション」設定を変えるだけで、中国語その他の多国語入力が可能になります。特別なソフトは別に必要ありません。
http://www2.yamanashi-ken.ac.jp/~yohnishi/pcinfo/windows_tips/in...
失礼ながら、ご質問の文面からは、実際にはウェブ構築をされたことのない方ではないかと拝察されます。根本的に基礎的な知識から学ばれることをおすすめします。
回答ありがとうございます。
根本的な理解が足りていないので勉強します。
A1.中国版である必要はありません。
A2.すべてのコンテンツをUTF-8で作成するなら、DBMSやWebサーバーソフトなどのミドルウェアが中国版である必要はありません。
A3.繁体字の場合はbig5、簡体字の場合はGB2312を選択することがありますが、UTF-8にするのが無難でしょう。
A4.UTF-8を使えば混在は可能です。
A5.UTF-8の場合、1~6バイトの可変長になります。
A6.これはサーバ側ではなくクライアント側に関する質問ですね。たとえば中国語版Windowsを購入すれば、中国語入力ができるIMEが付属しています。
回答ありがとうございます。
根本的な理解が足りていないので勉強します。
日本の環境で中国語対応するだけなら、何の問題もありません。
中国語で作るだけです。
でも、お話を伺っていると自身もなさそうなので、
このようなところに相談したほうがいいと思いますよ。
http://www.china-webby.com/web-develop/
無理しないで上司に相談してみては
回答ありがとうございます。
こういう会社もあるのですね。
)1.Webアプリが稼働するサーバーのOSは中国語版でなくてはならない?
そうでなくても良いですが、そのほうが良いと思います。
中国語を日本語に置き換えて考えてみればよくわかると思いますよ。
サーバーOSは英語版でも日本語WEBサイトを構築可能です。
)2.同様に、DBMSやWebサーバーソフトなどのミドルウェアも中国語版でなくてはならない?
なるべくその方が良いです。
たとえば日本語だとDBMSを選択するばあい、英語版だと文字化けしたりうまく行かなかったりします。
文字コードにUTF-8やUnicodeを用いてもです。
だからなるべく、中国版を使ったほうが良いです。
ミドルウェアでも文字に依存しないものは、どちらでも良いです。
)3.データベースに中国語を格納する場合、文字コードは何にどうすればよい?
UTF-8
Unicodeでも可能だと思いますが、4との関連もあるので避けたほうが良いでしょう。
Unicodeの場合、似たような漢字は同じコードに割り当てられてるという恐ろしい事実があります。
)4.データベースに英語、日本語、中国語の混在は可能?
UTF-8なら可能です。
)5.中国語の文字コードのバイト数は?
バイト数に依存する処理はお勧めできません。
)6.そもそも中国語を入力するには、何のソフトを使えばよい?OSを中国語版にすれば、中国語入力ソフトがついてくる?
日本語入力と似た仕組みで入力可能です。
回答ありがとうございます。UnicodeでははくUTF-8にしようと思います。
1.Webアプリが稼働するサーバーのOSは中国語版でなくてはならない?
NO.
コンピュータで扱う文字列データというのは、突き詰めれば特定のルールに従った数値(文字コード)に過ぎません。即ち、『中国語文字列を表現する数値列』を文字列として入出力出来さえすれば全く問題無い事になります。そして、(よっぽど変な物でもない限り)大抵のソフトウェアでは問題は発生しません。
2.同様に、DBMSやWebサーバーソフトなどのミドルウェアも中国語版でなくてはならない?
NO.
質問1と同じ理由です。
3.データベースに中国語を格納する場合、文字コードは何にどうすればよい?
DBの文字列データの設定を、適切な文字コードにする必要があります。
質問1への回答にて答えたように、文字という物は数値データでしかありません。所謂文字コードという物ですね。Shift-JISやUTF-8等の単語に聞き覚えがありませんか?
DBの文字コードに関する設定を、中国語の文字を表現出来る文字コードに設定する事で、DBに中国語文字列を格納出来るようになります。
具体的な設定手順については、お使いのDBに依存します。
4.データベースに英語、日本語、中国語の混在は可能?
DBで使用する文字コードに依存します.
DBの文字コードを、英語、日本語、中国語の各種文字を表現する物にする必要があります。Unicode(UTF-8, UTF-16等)が現実的な選択肢となるでしょう。
5.中国語の文字コードのバイト数は?
採用する文字コードに依存します.
ある文字コードAでは2バイトかもしれません。別の文字コードBでは3バイトかもしれません。或いはCという文字コードでは、文字によって使用するデータ長が異なるかもしれません。
6.そもそも中国語を入力するには、何のソフトを使えばよい?OSを中国語版にすれば、中国語入力ソフトがついてくる?
中国語を入力出来るIMEが必要になります.
例えば貴方が今日本語を入力出来ているのは、日本語入力が可能なIMEを使用している為です。中国語の場合も同様です。
"OSを中国語版にすれば"というより、『中国語の入力が可能なIMEがリリースされているOSが必要』と言う方が正しいでしょう。
その他に注意しておかなければならないことがあったら教えて下さい。
DBについて
既に日本語文字列のデータがDBに格納されていると思われるので、そのデータをDBに設定した文字コードの設定と矛盾しないよう変換する必要があるかもしれません。
----
id:matsunaga も指摘されていますが、webサイト構築に関する基本的な知識が欠けているように思われます。これを機に勉強される事をお勧めしますが、お仕事など期限の決められている案件である場合は、上司とよく相談された方が良いでしょう。
回答ありがとうございます。基本的な勉強が足りていませんので勉強します。
1.Webアプリが稼働するサーバーのOSは中国語版でなくてはならない?
No.
Utf8等のUnicodeに対応してれば、問題ないかと思います。
2.同様に、DBMSやWebサーバーソフトなどのミドルウェアも中国語版でなくてはならない?
No.
これも1と同様で、
Utf8等のUnicodeに対応してれば、問題ないかと思います。
3.データベースに中国語を格納する場合、文字コードは何にどうすればよい?
Utf8が一番普及しているのではないでしょうか?
4.データベースに英語、日本語、中国語の混在は可能?
Utf8であれば、対応可能です。
5.中国語の文字コードのバイト数は?
2バイト基本なるも、3バイトもあり。
と。一部上記Utf8で対応していない文字もあるそうです。
6.そもそも中国語を入力するには、何のソフトを使えばよい?OSを中国語版にすれば、中国語入力ソフトがついてくる?
Googleの中国語入力ソフト。 http://www.google.com/ime/pinyin/
また、WindowsのIMEに、標準で中国語入力ソフトが付いてます。
Linux等でも、設定変更するだけで、中国語入力可能ですね。
回答ありがとうございます。
回答ありがとうございます。UnicodeでははくUTF-8にしようと思います。