htmlページのスクレイピングをしたいのですが、取得したいページの文字コードがEUC-JPの為
文字化けしてしまいます。
このサイト(http://d.hatena.ne.jp/teramako/20080913/p1)で言われている
beforeSend: function(xhr){
xhr.overrideMimeType("text/html;charset=Shift_JIS");
},
も試してみたのですが上手くいきませんでした。
解決策を知ってらっしゃる方、いらっしゃいましたら教えていただけませんでしょうか。
よろしくお願いいたします。
jquery
http://ajax.googleapis.com/ajax/libs/jquery/1.8.3/jquery.min.js
CrossDomainAjax
http://jsajax.com/jQuery/crossDomainAjax/jquery.xdomainajax.js
HTMLもjavascriptもcharsetはEUC-JPを指定しています。
ソースコード
----------------------------------------------------------------------------------
<script type=text/javascript>
$(function() {
$.ajax({
url: url, //取得したいページのURL
type: 'GET',
beforeSend: function(xhr){
xhr.overrideMimeType("text/html;charset=euc-jp");
},
success: function(data) {
$('#container').html(data.responseText);
}
});
});
</script>
---------------------------------------------------------------------
コメント(0件)