Closed8

MecabをUTF-8でインストールしたい

monicamonica

デフォルトでMecabは本体、IPA辞書ともにEUC-JPで出力される、UTF-8で出力されるようにしたい

monicamonica

Mecab本体

tar xvfz mecab-x.x.tar.gz
cd mecab-x.x
./configure --with-charset=utf8
make
make check
sudo make install
monicamonica

IPA辞書

tar xvfz mecab-ipadic-x.x.tar.gz
cd mecab-ipadic-x.x
./configure --with-charset=utf8 --enable-utf8-only
make
sudo make install
monicamonica

nkfを使って自分でEUC-JPからUTF-8へエンコする記事があったけど壊れたので、--enable-utf8-onlyでIPA辞書側で勝手にエンコしてもらう方が安全だと思う

monicamonica

brew install mecab / brew install mecab-ipadic するとbrewの中身書き換えに行かないといけないからこっちの方が良さそう。
もしミスっても本体辞書ともにsudo make uninstallでクリーンアップ可能。

monicamonica

Cabochaも同じ、ただしMecab / IPA辞書 / CRF++が依存関係にあるので先にCRF++を入れる

CRF++

https://taku910.github.io/crfpp/

から CRF++本体の tar.gz をダウンロードして解凍

tar xvfz CRF++-x.x.tar.gz
cd CRF++-x.x
./configure
make
sudo make install

CRF++のビルド出力は/usr/local/includeに追加される

Cabocha

https://taku910.github.io/cabocha/

から CaboCha 本体の tar.gz をダウンロードして解凍

tar xvfz cabocha-x.x.tar.gz
cd cabocha-x.x
./configure --with-charset=utf8 --enable-utf8-only
make
sudo make install

この時g++(CXX)のinclude pathに/usr/local/includeがないときにinclude cannot resolveする

MakefileのDEFAULT_INCLUDES/usr/local/includeを追加しよう

- DEFAULT_INCLUDES = -I. -I$(top_builddir)
+ DEFAULT_INCLUDES = -I. -I$(top_builddir) -I/usr/local/include
このスクラップは2ヶ月前にクローズされました