Debian に MaCab と mecab-python をインストールする

Debian で MeCab と mecab-python を利用するには, 単純に apt や pip だけでインストールすることはできず, いくつか注意する点があります.

aptitude search mecab

MeCab のインストール

まず MeCab 本体を apt でインストールします.

sudo aptitude install mecab

MeCab 用辞書のインストール

MeCab 用の辞書をインストールします. EUC-JP のものと UTF-8 のものが存在するので注意が必要です.

辞書 UTF-8 EUC-JP
IPA mecab-ipadic-utf8 mecab-ipadic
Juman mecab-jumandic-utf8 mecab-jumandic
NAIST mecab-naist-jdic mecab-naist-jdic-eucjp

ここでは IPA の UTF-8 を用います.

sudo aptitude install mecab-ipadic-utf8

複数の辞書をインストールした場合は, update-alternatives で選択することができます.

sudo update-alternatives --config mecab-dictionary

mecab-python のインストール (システム)

システムに直接 mecab-python をインストールする場合は, apt から直接インストールできます.

sudo aptitude install python-mecab

mecab-python のインストール (virtualenv)

mecab-python をインストールするために必要な mecab-config を利用するために以下をインストールします.

sudo aptitude install libmecab-dev

virtualenv で作成した環境に mecab-python をインストールする場合は別途パッケージを取得する必要があります. mecab-python は PyPI に登録されていないため, ソースコードを直接取得します.

ソースコードは Google Code で公開されています.

MeCab のバージョンと同じバージョンの mecab-python をインストールする必要があります.

# Debian 7 wheezy
pip install https://mecab.googlecode.com/files/mecab-python-0.99.tar.gz
# Debian 8 jessie (2014/8/5 時点)
pip install https://mecab.googlecode.com/files/mecab-python-0.996.tar.gz

テスト

Python を起動し, import MeCab が実行できればインストール出来ています.

mecab-python に文字列を渡す時は UTF-8 や EUC-JP などに適切に decode し, mecab-python から文字列を受け取る時は UTF-8 や EUC-JP から適切に encode します.