1437818227 Python


http://goo.gl/D1zuhV
をやってみようと、wikipediaのダウンプデータを持ってきて、コマンドラインで叩いたのですが、画像のようなエラーがでます。

どうすればよいのでしょうか?

回答の条件
  • 1人1回まで
  • 登録:
  • 終了:2015/07/27 16:39:06
※ 有料アンケート・ポイント付き質問機能は2023年2月28日に終了しました。

ベストアンサー

id:TransFreeBSD No.1

回答回数668ベストアンサー獲得回数268

ポイント100pt

ロケールの問題だと思います。
Windowsだと標準がcp932になっていてutf-8のファイルをそのまま扱えないのでしょう。

なんとなく

import re

の前に

import locale
locale.setlocale(locale.LC_CTYPE, 'ja_JP.UTF-8')

とでも挿入すればデフォルトが変更されて解決しそうな気がします。

もしくは、

with open('jawiki-latest-stub-articles.xml','r') as wiki_stub_articles:

with open('jawiki-latest-stub-articles.xml','r', encoding='utf-8') as wiki_stub_articles:

など、3ヶ所の「with open(~) as ~:」を「with open(~, encoding='utf-8') as ~:」と、読み書きがutf-8となるよう指定してみてください。

参考:
http://d.hatena.ne.jp/kakurasan/20101103/p1
http://docs.python.jp/3/library/io.html#text-i-o
http://docs.python.jp/3/library/locale.html#locale.setlocale

id:webtomake

ありがとうございます!

読み込みの部分は解決できたのですが、肝心のコードが動かないですね。。。
出力されるCSVに何も書き込まれていない状態です。。残念。。

2015/07/25 23:28:20

コメントはまだありません

この質問への反応(ブックマークコメント)

「あの人に答えてほしい」「この質問はあの人が答えられそう」というときに、回答リクエストを送ってみてましょう。

これ以上回答リクエストを送信することはできません。制限について

回答リクエストを送信したユーザーはいません