人力検索はてな
モバイル版を表示しています。PC版はこちら
i-mobile

Python

http://goo.gl/D1zuhV
をやってみようと、wikipediaのダウンプデータを持ってきて、コマンドラインで叩いたのですが、画像のようなエラーがでます。

どうすればよいのでしょうか?

1437818227
●拡大する

●質問者: webtomake
●カテゴリ:ウェブ制作
○ 状態 :終了
└ 回答数 : 1/1件

▽最新の回答へ

1 ● TransFreeBSD
●100ポイント ベストアンサー

ロケールの問題だと思います。
Windowsだと標準がcp932になっていてutf-8のファイルをそのまま扱えないのでしょう。

なんとなく

import re

の前に

import locale
locale.setlocale(locale.LC_CTYPE, 'ja_JP.UTF-8')

とでも挿入すればデフォルトが変更されて解決しそうな気がします。

もしくは、

with open('jawiki-latest-stub-articles.xml','r') as wiki_stub_articles:

with open('jawiki-latest-stub-articles.xml','r', encoding='utf-8') as wiki_stub_articles:

など、3ヶ所の「with open(?) as ?:」を「with open(?, encoding='utf-8') as ?:」と、読み書きがutf-8となるよう指定してみてください。

参考:
http://d.hatena.ne.jp/kakurasan/20101103/p1
http://docs.python.jp/3/library/io.html#text-i-o
http://docs.python.jp/3/library/locale.html#locale.setlocale


webtomakeさんのコメント
ありがとうございます! 読み込みの部分は解決できたのですが、肝心のコードが動かないですね。。。 出力されるCSVに何も書き込まれていない状態です。。残念。。
関連質問

●質問をもっと探す●



0.人力検索はてなトップ
8.このページを友達に紹介
9.このページの先頭へ
対応機種一覧
お問い合わせ
ヘルプ/お知らせ
ログイン
無料ユーザー登録
はてなトップ