海外にあり外国人が管理している国際データベースの日本語訳を私が担当しています。
英語の原文を各国語の担当者が Web ブラウザを介して訳すPHPベースのシステムです。
これから仕事を始めるにあたって、以下の条件に最もかなう文字コードを選びたいと思います。
・閲覧ブラウザの文字化けや、非日本語ホスト上でのデータ変質(ビット落ち)などのトラブルが起きにくい。
・非日本語ホスト上で検索プログラムが作りやすい。
・将来的に使われなくなる恐れがなく、他の日本語訳担当者に引き継ぎやすい。
・入力できる環境が普及している。
http://www.mars.dti.ne.jp/~torao/program/appendix/japanese.html では JIS は化けやすいと
言っている一方で、
http://tohoho.wakusei.ne.jp/wwwxx005.htm のように JIS が一番化けない、
という人もいるので、よく分からなくなりました。
サイト管理者に日本語の知識がなく、日本語環境として poor であることを前提にアドバイスをお願いします。
(もちろん、文字コードは明示的に指定するつもりです)
URLは参考に。
動作するOSで変わるとはおもいますが、文字化けが多いShift-Jisは避けましょう。
Linuxならば大体はEUCが標準漢字コード(のはず)ですので、EUCをおすすめします。
Unicodeは国際標準ではありますが対応しているソフトが少ない為、あまりおすすめできません。
> サイト管理者に日本語の知識がなく、日本語環境として poor であることを前提
ということですので、JISがよろしいのではないでしょうか。
JISは日本語に対応していないソフトでみても壊れません。
実際、メールなどもJISでやりとりされています。
>というところで、EUC か JIS のどちらかですね。
>データベースなので検索の容易さについての意見もお待ちしております。
プログラムを作るときにはEUCの方が都合が良いです。
JISだといろんなときに変換かませなければいけないことがあります。
OSのデフォルトがShift-JIS(Windows)かEUC(Unix)ですから。
後はデータベースなどのミドルウェアを使うのであれば使用するデータベースも考えたほうが良いですよ。
まれに扱えるコードなどに制限がある場合があります。
まぁ統一しなくても何とかなりますけどね:p