Perl　utf8モジュールの効果と文字化けについて

Question

nagato-yuki

31

22もっと見る

300pt

インターネットウェブ制作

Perl　utf8モジュールの効果と文字化けについて

Perl言語を活用しまして、外部サイトのRSSファイルを取得し、その取得したRSSの内容を当方のサイトに出力したいと思っております。
RSSを取得するモジュールとして「XML::FeedPP」というモジュールを活用します。（http://www.kawa.net/works/perl/feedpp/feedpp.html）
今回の質問はutf8モジュールを使用したときに特定の条件で文字化けがおきる理由が知りたいということです。
以下に、RSSファイルを取得しサイトに出力する４つのケースを記述します。（すべてUTF8コード）

ケース１、http://nichista.seesaa.net/image/case1.txt
ケース２、http://nichista.seesaa.net/image/case2.txt
ケース３、http://nichista.seesaa.net/image/case3.txt
ケース４、http://nichista.seesaa.net/image/case4.txt

さて、途中の13行目から「#ケース１～４）」の部分を変更して複数の条件でプログラムを走らせます。
上記の４つのケースのうち、「ケース３」のみ文字化けしてしまいます。
しかし、なぜ「ケース３」だけこのような文字化け現象がおきるのでしょうか？
この現象の理由を知りたく存じます。

回答の条件

1人5回まで

登録：2011/10/22 13:23:46
終了：2011/10/28 12:08:52

※ 有料アンケート・ポイント付き質問機能は2023年2月28日に終了しました。

コメントはまだありません

「あの人に答えてほしい」「この質問はあの人が答えられそう」というときに、回答リクエストを送ってみてましょう。

これ以上回答リクエストを送信することはできません。制限について

リクエスト送信済

回答リクエストを送信したユーザーはいません

うぃんど · Accepted Answer · 2011-10-22T13:52:09+09:00

外部のページを参照するのは面倒なので、まずは１つにまとめさせてもらいました

#!/usr/bin/perl
use utf8;
use strict;
use XML::FeedPP;

print "Content-type: text/html\n\n";
print "<html><head><meta http-equiv=\"Content-Type\" content=\"text/html\; charset=UTF-8\"><title>test</title></head><body>\n";
my $source = 'http://www.nicovideo.jp/ranking/fav/daily/g_popular?rss=2.0';
my $feed = XML::FeedPP->new( $source );
print "Title: ", $feed->title(), "<br />\n";
foreach my $item ( $feed->get_item() ) {

#ケース１
	print "Title: ", $item->title(), "<br />";
#ケース１

#ケース２
	my $stock = $item->title();
	print "Title: $stock<br />";
#ケース２

#ケース３
	my $stock = $item->title();
	print "タイトル: $stock<br />";
#ケース３

#ケース４
	my $stock = $item->title();
	utf8::decode($stock);
	print "タイトル: $stock<br />";
#ケース４

}
print "</body></html>\n";
exit;

さて、本題への答えですが、外部から読み込んだものは、

そのキャラクタセットなどには一切関知せず、

「そのままの形」で保持されていることが原因となっています

対処例から述べますと、use open IN などで、

「外部から読み込んだものはutf-8として取り扱う」といった、

フラグを立てるようにするなどします

ケース１および２では、

Titleという半角英数字との組み合わせであるために、特に問題は発生せず、

ケース４においては、

単独でフラグを立ててやってますので、これまた問題は発生せず、

問題のケース３では、

日本語との組み合わせになっているため、

そのままの形でつかってくれれば良いものを・・・

気を利かせて（というのは言葉のアヤですが）変換しようとしてしまうようなのです

参考

http://www.rwds.net/kuroita/program/Perl_unicode.html

Perl　utf8モジュールの効果と文字化けについて

ベストアンサー

うぃんど262511492011/10/22 13:52:09

コメント（0件)

この質問への反応（ブックマークコメント）

Perl utf8モジュールの効果と文字化けについて

ベストアンサー

うぃんど262511492011/10/22 13:52:09

コメント（0件)

この質問への反応（ブックマークコメント）

Perl　utf8モジュールの効果と文字化けについて