公式サイトからMeCab本体とIPA辞書をダウンロードし、インストール手順に沿ってインストールを完了しました。後にpythonで使う予定なのでmecab-python-0.994.tar.gzもインストール完了しています。
% mecab
で解析モード?みたいな状態にはなるのですが、例えば「こんにちは」と入力すると
こんにち�� ����,����,*,*,*,*,*
� ��,������³,*,*,*,*,*
EOS
こんな感じになります。64bit版でも(VMwareでインストールした)32bit版でもダメでした。
インストール時に
・./configure --enable-utf8-only
・./configure --with-charset=utf8
と、文字コードを指定することは試しましたが改善しませんでした。
知識不足でどういう情報を出せば回答しやすいかもわからず恐縮なのですが、文字化けをなくす方法を教えて頂きたいです。よろしくお願いします。
Ubuntu公式パッケージにもUTFの辞書が用意されていますね。
これを使うのが一番楽なのではないでしょうか。
"mecab"と"mecab-ipadic-utf8"をapt-getなどでインストールすればそれで終わりです。
(自分でインストールした物を残す場合は、どちらの物を使うのか、常にフルパスで指定するのを忘れないように)
"mecab-ipadic-utf8"をインストールするとこれが標準の辞書に設定されるようです。
実行時に辞書を指定することもできます。
mecab -d /var/lib/mecab/dic/ipadic-utf8
フォント次第なようです。
たいていフォント設定で直るようです。以前はフォントの設定等もそのアプリケーションごとに勝手なメニューに入れ込んでいたようですが、最近はいくつかのパターンに収まるみたいです。ですから、文字化けして操作方法すら分からなくなったら、取りあえずアクセラレーションキーでAlt + Eで編集メニューを開けばよいでしょう。それからいくつかのタブを探しつつ、フォント選択メニューを探して、そこで日本語表示が可能なフォント(例えばIPAとか・・・)を選んでやれば何とかなる可能性が高いと思います。
http://blog.livedoor.jp/poisonous_fish/archives/52062141.html