Debian で MeCab と mecab-python を利用するには, 単純に apt や pip だけでインストールすることはできず, いくつか注意する点があります.
MeCab のインストール
まず MeCab 本体を apt でインストールします.
sudo aptitude install mecab
MeCab 用辞書のインストール
MeCab 用の辞書をインストールします. EUC-JP のものと UTF-8 のものが存在するので注意が必要です.
辞書 | UTF-8 | EUC-JP |
---|---|---|
IPA | mecab-ipadic-utf8 | mecab-ipadic |
Juman | mecab-jumandic-utf8 | mecab-jumandic |
NAIST | mecab-naist-jdic | mecab-naist-jdic-eucjp |
ここでは IPA の UTF-8 を用います.
sudo aptitude install mecab-ipadic-utf8
複数の辞書をインストールした場合は, update-alternatives で選択することができます.
sudo update-alternatives --config mecab-dictionary
mecab-python のインストール (システム)
システムに直接 mecab-python をインストールする場合は, apt から直接インストールできます.
sudo aptitude install python-mecab
mecab-python のインストール (virtualenv)
mecab-python をインストールするために必要な mecab-config を利用するために以下をインストールします.
sudo aptitude install libmecab-dev
virtualenv で作成した環境に mecab-python をインストールする場合は別途パッケージを取得する必要があります. mecab-python は PyPI に登録されていないため, ソースコードを直接取得します.
ソースコードは Google Code で公開されています.
MeCab のバージョンと同じバージョンの mecab-python をインストールする必要があります.
# Debian 7 wheezy pip install https://mecab.googlecode.com/files/mecab-python-0.99.tar.gz # Debian 8 jessie (2014/8/5 時点) pip install https://mecab.googlecode.com/files/mecab-python-0.996.tar.gz
テスト
Python を起動し, import MeCab が実行できればインストール出来ています.
mecab-python に文字列を渡す時は UTF-8 や EUC-JP などに適切に decode し, mecab-python から文字列を受け取る時は UTF-8 や EUC-JP から適切に encode します.