http://www.nikkei.co.jp/」のページの上の方にある検索にて、検索文字列

「ステンレス籠」(「ステンレス」は半角カタカナで)と入れて記事検索すると、
次に出てくるページで、検索文字列が化けて出てきます。
(実は、単に「籠」だけでも化けるんですが・・・)

この現象について解説しているページを教えてください。

回答の条件
  • URL必須
  • 1人2回まで
  • 登録:2005/12/19 17:19:24
  • 終了:--

回答(3件)

id:gaba No.1

gaba回答回数90ベストアンサー獲得回数12005/12/19 18:02:45

ポイント50pt

http://www.tohoho-web.com/wwwkanji.htm

漢字コードについて

※[どうして文字化けがおこるのか?] をご参照下さい。


検索元ページと検索結果ページの文字コードが異なるため、入力した文字列の文字コードを ShiftJIS → EUC と変換しているのですが、この処理のせいで文字化けしてしまいます。

ShiftJIS と EUC の漢字コードが一部重複しており、文字コード変換時に変換元の文字コードを誤判定してしまう事が原因です。


試しに検索結果ページで、再度「ステンレス」と入力して検索しても文字化けしません。

変換元も変換先も EUC であるため、上記のような誤判定が発生しないからです。

http://www.unixuser.org/~euske/doc/kanjicode/

JIS, EUC, SJIS $B$N4A;z%3!<%I$K$D$$$F(B

id:t-ueno

なるほど、文字コード変換の誤判定ですか・・・

ありがとうございます。

2005/12/19 21:14:20
id:nyarla-net No.2

にゃるら回答回数35ベストアンサー獲得回数22005/12/19 18:07:56

ポイント50pt

http://www.shtml.jp/mojibake/sjis_cgi.html

CGIで特定の文字(表・予・申・能など)が文字化けする

たぶんサーバ側の文字コードの処理の仕方がまずいんだと思います。

検索フォーム(*1)のページの文字コードがShift-JISで、

検索後のページ(*2)の文字コードがEUC-JPなんで、

参考URLに書いてあることが関係あるんじゃないでしょうか。


*1 http://www.nikkei.co.jp/

*2 http://kensaku.nikkei.co.jp/cgi-bin/common.cgi

id:t-ueno

ありがとうございます。参考URLはなかなか興味深いですね。ただ、そのものずばりの回答は得られませんでした。

文字コード処理である「らしい」ということは分かりましたが、具体的に、どのコードをどのように誤判定しているのか、分かりませんでしょうか?

2005/12/19 21:24:08
id:u-chan No.3

u-chan回答回数195ベストアンサー獲得回数02005/12/19 22:20:16

ポイント50pt

そもそも「半角カナ」自体が機種依存文字なので、ネットでの入力の際、使用しないことをお薦めします。

また「籠」についてですが、紹介ページの「1983 年、JIS と常用漢字と人名漢字」欄で。

-------------------------

以下の 4 組について、追加と同時に入れ替えも行なわ

れた。追加されたのは左側の字体。新しいコード位置

に置かれたのは右側の字体。これらも文字化けの可能性

あり。どっちが表示されるかわからない。特に右側の

字体(以前からあった字体)を使う場合、表示されない

可能性も含めて、覚悟すること。

-------------------------

とあるので、もともとネットの世界では化けやすい文字コードのようです。


ご参考=1.「鰺」も化けますね。

id:t-ueno

いろいろ分かりました。

どうもありがとうございました。

2005/12/19 22:36:28

コメントはまだありません

この質問への反応(ブックマークコメント)

「あの人に答えてほしい」「この質問はあの人が答えられそう」というときに、回答リクエストを送ってみてましょう。

これ以上回答リクエストを送信することはできません。制限について

絞り込み :
はてなココの「ともだち」を表示します。
回答リクエストを送信したユーザーはいません