1437818227 Python


http://goo.gl/D1zuhV
をやってみようと、wikipediaのダウンプデータを持ってきて、コマンドラインで叩いたのですが、画像のようなエラーがでます。

どうすればよいのでしょうか?

回答の条件
  • 1人1回まで
  • 13歳以上
  • 登録:2015/07/25 18:57:07
  • 終了:2015/07/27 16:39:06

ベストアンサー

id:TransFreeBSD No.1

TransFreeBSD回答回数654ベストアンサー獲得回数2632015/07/25 21:24:36

ポイント100pt

ロケールの問題だと思います。
Windowsだと標準がcp932になっていてutf-8のファイルをそのまま扱えないのでしょう。

なんとなく

import re

の前に

import locale
locale.setlocale(locale.LC_CTYPE, 'ja_JP.UTF-8')

とでも挿入すればデフォルトが変更されて解決しそうな気がします。

もしくは、

with open('jawiki-latest-stub-articles.xml','r') as wiki_stub_articles:

with open('jawiki-latest-stub-articles.xml','r', encoding='utf-8') as wiki_stub_articles:

など、3ヶ所の「with open(~) as ~:」を「with open(~, encoding='utf-8') as ~:」と、読み書きがutf-8となるよう指定してみてください。

参考:
http://d.hatena.ne.jp/kakurasan/20101103/p1
http://docs.python.jp/3/library/io.html#text-i-o
http://docs.python.jp/3/library/locale.html#locale.setlocale

id:webtomake

ありがとうございます!

読み込みの部分は解決できたのですが、肝心のコードが動かないですね。。。
出力されるCSVに何も書き込まれていない状態です。。残念。。

2015/07/25 23:28:20

コメントはまだありません

この質問への反応(ブックマークコメント)

「あの人に答えてほしい」「この質問はあの人が答えられそう」というときに、回答リクエストを送ってみてましょう。

これ以上回答リクエストを送信することはできません。制限について

絞り込み :
はてなココの「ともだち」を表示します。
回答リクエストを送信したユーザーはいません