人力検索はてな
モバイル版を表示しています。PC版はこちら
i-mobile

「http://www.nikkei.co.jp/」のページの上の方にある検索にて、検索文字列
「ステンレス籠」(「ステンレス」は半角カタカナで)と入れて記事検索すると、
次に出てくるページで、検索文字列が化けて出てきます。
(実は、単に「籠」だけでも化けるんですが・・・)

この現象について解説しているページを教えてください。

●質問者: t-ueno
●カテゴリ:ウェブ制作
✍キーワード:カタカナ ステンレス 文字列 検索
○ 状態 :終了
└ 回答数 : 3/3件

▽最新の回答へ

1 ● gaba
●50ポイント

http://www.tohoho-web.com/wwwkanji.htm

漢字コードについて

※[どうして文字化けがおこるのか?] をご参照下さい。


検索元ページと検索結果ページの文字コードが異なるため、入力した文字列の文字コードを ShiftJIS → EUC と変換しているのですが、この処理のせいで文字化けしてしまいます。

ShiftJIS と EUC の漢字コードが一部重複しており、文字コード変換時に変換元の文字コードを誤判定してしまう事が原因です。


試しに検索結果ページで、再度「ステンレス」と入力して検索しても文字化けしません。

変換元も変換先も EUC であるため、上記のような誤判定が発生しないからです。

http://www.unixuser.org/~euske/doc/kanjicode/

JIS, EUC, SJIS $B$N4A;z%3!<%I$K$D$$$F(B

◎質問者からの返答

なるほど、文字コード変換の誤判定ですか・・・

ありがとうございます。


2 ● にゃるら
●50ポイント

http://www.shtml.jp/mojibake/sjis_cgi.html

CGIで特定の文字(表・予・申・能など)が文字化けする

たぶんサーバ側の文字コードの処理の仕方がまずいんだと思います。

検索フォーム(*1)のページの文字コードがShift-JISで、

検索後のページ(*2)の文字コードがEUC-JPなんで、

参考URLに書いてあることが関係あるんじゃないでしょうか。


*1 http://www.nikkei.co.jp/

*2 http://kensaku.nikkei.co.jp/cgi-bin/common.cgi

◎質問者からの返答

ありがとうございます。参考URLはなかなか興味深いですね。ただ、そのものずばりの回答は得られませんでした。

文字コード処理である「らしい」ということは分かりましたが、具体的に、どのコードをどのように誤判定しているのか、分かりませんでしょうか?


3 ● u-chan
●50ポイント

http://www.geocities.co.jp/HeartLand/7406/h/mojibake.html

文字化け入門

そもそも「半角カナ」自体が機種依存文字なので、ネットでの入力の際、使用しないことをお薦めします。

また「籠」についてですが、紹介ページの「1983 年、JIS と常用漢字と人名漢字」欄で。

?????????????????????????

以下の 4 組について、追加と同時に入れ替えも行なわ

れた。追加されたのは左側の字体。新しいコード位置

に置かれたのは右側の字体。これらも文字化けの可能性

あり。どっちが表示されるかわからない。特に右側の

字体(以前からあった字体)を使う場合、表示されない

可能性も含めて、覚悟すること。

?????????????????????????

とあるので、もともとネットの世界では化けやすい文字コードのようです。


ご参考=1.「鰺」も化けますね。

◎質問者からの返答

いろいろ分かりました。

どうもありがとうございました。

関連質問


●質問をもっと探す●



0.人力検索はてなトップ
8.このページを友達に紹介
9.このページの先頭へ
対応機種一覧
お問い合わせ
ヘルプ/お知らせ
ログイン
無料ユーザー登録
はてなトップ