「ステンレス籠」(「ステンレス」は半角カタカナで)と入れて記事検索すると、
次に出てくるページで、検索文字列が化けて出てきます。
(実は、単に「籠」だけでも化けるんですが・・・)
この現象について解説しているページを教えてください。
※[どうして文字化けがおこるのか?] をご参照下さい。
検索元ページと検索結果ページの文字コードが異なるため、入力した文字列の文字コードを ShiftJIS → EUC と変換しているのですが、この処理のせいで文字化けしてしまいます。
ShiftJIS と EUC の漢字コードが一部重複しており、文字コード変換時に変換元の文字コードを誤判定してしまう事が原因です。
試しに検索結果ページで、再度「ステンレス」と入力して検索しても文字化けしません。
変換元も変換先も EUC であるため、上記のような誤判定が発生しないからです。
http://www.unixuser.org/~euske/doc/kanjicode/
JIS, EUC, SJIS $B$N4A;z%3!<%I$K$D$$$F(B
http://www.shtml.jp/mojibake/sjis_cgi.html
CGIで特定の文字(表・予・申・能など)が文字化けする
たぶんサーバ側の文字コードの処理の仕方がまずいんだと思います。
検索フォーム(*1)のページの文字コードがShift-JISで、
検索後のページ(*2)の文字コードがEUC-JPなんで、
参考URLに書いてあることが関係あるんじゃないでしょうか。
ありがとうございます。参考URLはなかなか興味深いですね。ただ、そのものずばりの回答は得られませんでした。
文字コード処理である「らしい」ということは分かりましたが、具体的に、どのコードをどのように誤判定しているのか、分かりませんでしょうか?
そもそも「半角カナ」自体が機種依存文字なので、ネットでの入力の際、使用しないことをお薦めします。
また「籠」についてですが、紹介ページの「1983 年、JIS と常用漢字と人名漢字」欄で。
-------------------------
以下の 4 組について、追加と同時に入れ替えも行なわ
れた。追加されたのは左側の字体。新しいコード位置
に置かれたのは右側の字体。これらも文字化けの可能性
あり。どっちが表示されるかわからない。特に右側の
字体(以前からあった字体)を使う場合、表示されない
可能性も含めて、覚悟すること。
-------------------------
とあるので、もともとネットの世界では化けやすい文字コードのようです。
ご参考=1.「鰺」も化けますね。
いろいろ分かりました。
どうもありがとうございました。
なるほど、文字コード変換の誤判定ですか・・・
ありがとうございます。