「障沂エ」とは何ですか?


「高橋」の変換ミスや文字化けなのではないかと思うのですが、
明らかに「高橋」が収まるべき場所に「障沂エ」という文字が入っているケースがあります。
http://www.google.co.jp/search?hl=ja&rlz=1T4GGLG_ja&q=%E9%9A%9C%E6%B2%82%E3%82%A8&lr=&aq=f&oq=

これは一体何が起きているのでしょう。
どういう条件で「高橋」が「障沂エ」になってしまうのですか?

回答の条件
  • 1人2回まで
  • 登録:2009/12/20 15:31:16
  • 終了:2009/12/21 00:26:13

回答(2件)

id:sumike No.1

ミケ回答回数379ベストアンサー獲得回数252009/12/20 21:55:34

ポイント35pt

高橋さんの高が、はしご高(髙)になっていると文字化けしやすいようです。

http://www.kawa.net/works/jcode/uni-escape.html

id:corgi_corgi

回答ありがとうございます。

状況を補足すると、あるフォームに「高橋」さんが自分の名前を入力されたのですが、

フォームの画面上でも、フォームから届く内容通知のメールも、

「高橋」が「障沂エ」になってしまったのです。

入力した人ご本人に聞いてみたところ、「普通の高い低いの高を入れた」とのことでした。

何かわかる方、よろしくお願いいたします。

2009/12/20 22:04:07
id:speedster No.2

speedster回答回数767ベストアンサー獲得回数162009/12/20 23:54:03

ポイント35pt

http://d.hatena.ne.jp/robincyan13/20090626

やはり「高橋」のはしご高という入力による文字化けかと。。。

ここでは高橋真梨子ですね。。。

id:corgi_corgi

フォームのページで実際入力して確認してみたところ、

「高橋」:文字化けなし

「髙橋」:「障沂エ」に文字化け

となりました。

(入力したご本人の勘違いか言い間違いだったのかもしれません)

大変勉強になりました。ありがとうございました。

2009/12/21 00:18:34
  • id:zifree
    途中で分からずギブアップしたのでコメントにて。
    障沂エは文字化けで、文字化けしているのは「高」で始まる高橋ではなく
    「髙」(はしごたか)で始まる「髙橋」ではないかと推測します。
    「髙」はEUCに定義されておらず、JISでもIBM拡張文字・NEC選定IBM拡張文字と二つ定義が存在しているなど、
    しばしば文字化けの原因となっているようでいかにも怪しいです。
    ただ、どう文字化けして障沂エになったのか判明しませんでした。
    http://yossy.iimp.jp/wp/?p=58
    http://www.fujistaff.com/it/column/mojicode/16.html
  • id:suppadv
    文字化けを解読するツールで見てみましたが、高橋にも髙橋にもなりませんでした。
    ただ、「竹内まりやさん・障沂エ真梨子さん・松田聖子さん」というものが出てくるので、文字化けであることは確かだと思います。
    通常の解読ツールでは解読できない、レアな文字化けのようで、原因は良く判りませんでした。
  • id:corgi_corgi
    zifree様、suppadv様、コメントありがとうございます。
    上にも書きましたが、状況を補足すると、
    あるフォームに「高橋」さんが自分の名前を入力されたところ、
    フォームの画面上でも、フォームから届く内容通知のメールも、
    「高橋」が「障沂エ」になってしまったのです。
    入力した人ご本人に聞いてみたところ、「普通の高い低いの高を入れた」とのことでした。
    (はしごたかではなかったようです)
    もし何かお分かりでしたら、またぜひお願いいたします。
  • id:ardarim
    「障沂エ」はシフトJISで
    8F E1 9F 8B B4
    の5バイトで表されます。
    このうち最後の2バイト(8B B4)は「橋」のシフトJISコードで、正しいですが、その前にシフトJISとしては不正なバイトシーケンスである3バイト(8F E1 9F)が来てしまっています。シフトJISは1バイトでもずれると後続の文字もずれてしまう仕様なので「橋」も文字化けしてしまっています。

    そのため、シフトJISが絡んだ文字コード処理が原因である可能性が高いと思うのですが、先行する8F E1 9Fが異常変換されてしまう過程が謎です。8F + 2バイト、なので、EUCが絡んでいるかもしれません(根拠なし)

    フォームを入力するページの文字コード、サーバ側プログラムの文字コード(と処理系)に依存しているとは思いますが...
  • id:zifree
    実際に検証したわけではなく自信がないので、再度コメントにて。

    suppadvさんの言及されている
    > ただ、「竹内まりやさん・障沂エ真梨子さん・松田聖子さん」というものが出てくるので、
    は以下のどちらかのページ(Shift-JIS)かと思います。
    http://mblog.excite.co.jp/user/qsteer/date/ym/index.php?ym=2009/06&page=1
    http://mblog.excite.co.jp/user/qsteer/entry/detail/?id=11455565
    上記の元ページ(UTF-8)を見ると「竹内まりやさん・髙橋真梨子さん・松田聖子さん」
    http://robincyan13.blog.so-net.ne.jp/2009-06-26
    と記載されています。
    これが(高橋さんの言い分とは矛盾しますが)「髙橋」ではないかと推測した根拠です。

    また、上記の文字化けページはPHPで生成されています(URL中にindex.phpとある)。
    ひょっとして、文字化けが起きるのはPHP固有の問題ではないかと思いました。
    corgi_corgiさんへ二つ確認なのですが、
    ・文字化けしているフォームはPHPで作られたものですか?
    ・corgi_corgiさん自身がフォームに「髙橋」「高橋」と入力した場合、結果はどうなりますか?
    「髙橋」だとやはり文字化けしてしまいますか?

    上記がどちらも「Yes」であれば
    「文字コードに起因するPHP側の問題で文字化けが発生している」ということになります。
    対処法になりそうなページを記載しておきます。
    http://d.hatena.ne.jp/aozora_abc/20070717/
  • id:corgi_corgi
    ardarim様、zifree様
    コメントありがとうございます。
    フォームがPHPかどうかは、自分で作成・設置したものではなくレンタルのもののため、
    現時点では詳細はわかりませんでした。
    フォームのページでzifree様の仰ったように実際入力して確認してみたところ、
    「高橋」:文字化けなし
    「髙橋」:「障沂エ」に文字化け
    となりました。
    (入力したご本人の勘違いか言い間違いだったのかもしれません)
    大変勉強になりました。ありがとうございました。

    一番最初にはしごたかのことを教えてくださったので、zifree様に
    わずかですがポイントを送信させていただきました。
  • id:zifree
    ポイントありがとうございます。
    文字コード変換がどのように行われたのかが説明できず、まだ納得の行かない所もあるのですが
    少なくとも元の文字列は「髙橋」で、レンタルしたフォームの問題で文字化けしたようですね。
    # PHPかどうかはともかくとして、それ以外の推測は大体当たっていたようで良かったです・・・。

この質問への反応(ブックマークコメント)

「あの人に答えてほしい」「この質問はあの人が答えられそう」というときに、回答リクエストを送ってみてましょう。

これ以上回答リクエストを送信することはできません。制限について

絞り込み :
はてなココの「ともだち」を表示します。
回答リクエストを送信したユーザーはいません