私のブログを訪問してくれる人のリンク参照元が検索エンジンだった場合、そのリンクをコピーしてブラウザに貼り付けると文字化けを起こしていることがよくあります。
例えば、グーグルやヤフーで特定のキーワードで私のサイトを訪れてくれるとします。そのリンク元をコピーしてブラウザに貼り付けるとキーワードがよくわからない漢字や文字化けをおこしてしまいます。ブラウザの表示のエンコードを変更してもなおりません。ほとんどの場合は文字化けしないのですが、たまに文字化けをおこします。
なぜこういった事が起こるのでしょうか?日本国内から訪れてくれるので外人というのは考えにくいです。日本人が日本から検索したと想定した場合、なぜこういった事態がおこるのか?どうやったらこの文字化けを読める状態にできるのかお教えください。ツール、サイト、なんでもOKです。
ログの保存は何をお使いですか?
例えば、保存する文字数が256文字までとか制限、文字数が決まっていると、q~のパラメーターが欠けて保存され、ブラウザのURL欄に貼り付けても、正しく認識されていないとか?
*コピーミスは考えにくいので、元の段階で長文キーワードだと正しく保管されていないのでは?
例1)
http://www.google.co.jp/search?hl=ja&q=%E4%BB%95%E6%A7%98%E6%9B%...
↑みたいに、正しく保存されません。ご質問はこんな感じですか?
だとすると、応急処置として、
後ろの%E3%81を消して、
http://www.google.co.jp/search?hl=ja&q=%E4%BB%95%E6%A7%98%E6%9B%...
とすると、
仕様書 読まな
で、検索されると思います。※文字コードが正しく認識されないので、削っただけですが。
元はたぶん、
仕様書 読まない
の[い]までなのですが、
%E3%81
この後ろのコードが欠けているので、うまく変換できないからだと思います。
もんだいの[い]ですが、%E3%81%84なので、
例2)かってにコードを想像で足してみた
http://www.google.co.jp/search?hl=ja&q=%E4%BB%95%E6%A7%98%E6%9B%...
と、%84をプラスしました。これは勝手に予想しただけで、いつも%84じゃないです。。。
じゃなくて、検索キーワードが長文で、取りこぼしているとしたら の解決策ですよね。
googleの検索ワードはq=なので、ここを数文字削って、表示させてみるのが、私の案です。
また、
q=%E4%BB%95%E6%A7%98%E6%9B%B8%E3%80%80%E8%AA%AD%E3%81%BE%E3%81%AA%E3%81%84
が、検索文字列なので、UTF-8のデコードツールなどを使用してみては?
http://www.google.co.jp/search?sourceid=navclient&hl=ja&ie=UTF-8...
解決の糸口となれば幸いです。
※ぜんぜん、外していたらスミマセン。