proanagram回答ポイント なしウォッチ

VPS上のCentOS 6.3で、形態素解析エンジン「MeCab」をUTF-8で使いたい


……のですが、辞書等がEUC-JPになってしまいます。
VPSはGMO・さくらで試用期間。


【やったこと】

# ■libiconv入れ
wget http://ftp.gnu.org/pub/gnu/libiconv/libiconv-1.14.tar.gz
./configure --prefix=/usr/local

■ iconv --version
■ /usr/local/bin/iconv --version
→iconv (GNU libiconv 1.14)

■/usr/bin/iconv --version
iconv (GNU libc) 2.12

■gcc/g++ -v
gcc version 4.4.6 20120305 (Red Hat 4.4.6-4) (GCC)

>vi /etc/ld.so.conf.d/lib.conf
/usr/local/lib/
ldconfig

# ■MeCab+辞書入れ
wget http://mecab.googlecode.com/files/mecab-0.995.tar.gz
wget http://mecab.googlecode.com/files/mecab-ipadic-2.7.0-20070801.tar.gz
 本体
./configure --with-charset=utf-8 --enable-utf8-only LIBS=-liconv
 辞書
./configure --with-charset=utf-8

こんな感じでやっているのですが、
>echo "隣の客は良く柿食う客だ"| nkf -e | mecab | nkf -w
これで結果が正常に表示される辺り、辞書がどうもUTF-8ではなくEUC-JPになってるようです。
mecab -Dでは辞書情報がutf-8になっているのですが……

filename: /usr/local/lib/mecab/dic/ipadic/sys.dic
charset: utf-8

どうか知恵を貸していただけないでしょうか。よろしくお願い致します。

ログインして回答する

ベストアンサー

その他の回答

この質問へのコメント

コメントはありません

この質問への反応(ブックマークコメント)

質問の情報

登録日時
2013-02-14 18:11:19
終了日時
2013-02-18 20:26:05
回答条件
1人5回まで

この質問のカテゴリ

この質問に含まれるキーワード

形態素解析29nkf23gcc113Red Hat51wget72GMO45GNU59UTF-8628CentOS474MeCab39VPS276DIC26さくら498prefix6EUC-JP181vi122

人気の質問

メニュー

PC版