mecab utf-8のインストール

ここでは --prefix=$HOME/vr/mecab とする。

wget 'http://downloads.sourceforge.net/project/mecab/mecab/0.98/mecab-0.98.tar.gz?use_mirror=jaist'
tar zxvf mecab-0.98.tar.gz
cd mecab-0.98
./configure --with-charset=utf-8 --prefix=$HOME/vr/mecab &&make install
cd -
wget 'http://downloads.sourceforge.net/project/mecab/mecab-ipadic/2.7.0-20070801/mecab-ipadic-2.7.0-20070801.tar.gz?use_mirror=jaist'
tar zxvf mecab-ipadic-2.7.0-20070801.tar.gz
cd /mecab-ipadic-2.7.0-20070801
$PATH=~/vr/mecab/bin:$PATH ./configure --with-charset=utf8 &&make install
cd -

mecab-ipadic辞書のutf8化を試したが、何回やってもEUCになる。最終的に以下で成功したのだと思う。

$make clean && ./configure --with-charset=utf-8 && make && make install
...
config.status: creating Makefile
/home/xxxxxxx/vr/mecab/libexec/mecab/mecab-dict-index -d . -o . -f EUC-JP -t utf-8
...

nkf -gでチェックするとutf8になっているようだ。成功!

$ echo a|mecab |nkf -g
UTF-8