0

MeCabインストールメモ

fedora7にMeCabをインストールした際のメモです。
ほとんどここのパクリです。

MeCab本体をソースからインストール
# wget http://nchc.dl.sourceforge.net/sourceforge/mecab/mecab-0.96.tar.gz
# tar -xvzf mecab-0.96.tar.gz
# cd mecab-0.96
# ./configure
# make
# make install

辞書は別なので辞書もインストール
# wget http://nchc.dl.sourceforge.net/sourceforge/mecab/mecab-ipadic-2.7.0-20070610.tar.gz
# tar -xvzf mecab-ipadic-2.7.0-20070610.tar.gz
# cd mecab-ipadic-2.7.0-20070610
# ./configure
# make
# make install

デフォルトではEUCなのでUTF8に変更しておく。
# /usr/local/libexec/mecab/mecab-dict-index -f euc-jp -t utf-8
# make install

PHPからMeCabを使う
phpizeがない場合
# yum install php-devel

phpで利用できるようにPHPモジュール(MeCab extension)をインストール
# wget http://page2.xrea.jp/pub/php_mecab-0.2.0.tgz
# tar -xvzf php_mecab-0.2.0.tgz
# cd php_mecab-0.2.0
# phpize
# ./configure --with-php-config=/usr/bin/php-config --with-mecab=/usr/local/bin/mecab-config
# make
# make install

デフォルトの辞書では不十分に感じてくると思うので自分で単語を追加するユーザー辞書を用意します。
デフォルトの辞書+ユーザー辞書で運用します。
適当なフォルダに移って編集用のcsvファイルと実際の辞書となるdicファイルを作成します。
# touch userDic.csv
# touch userDic.dic
ブラウザから操作する時のために
# chmod 666 userDic.*

csvファイルに一行一単語で登録していく
詳しくはこちら
# vi userDic.csv
ほげ,-1,-1,10,名詞,一般,*,*,*,*,ほげ,ホゲ,ホゲ

ユーザー辞書をMeCab認識させる
# vi /usr/local/etc/mecabrc

下記の一行を追加
userdic = /home/www/userDic.dic

csvのをdicファイルのコピー
/usr/local/libexec/mecab/mecab-dict-index -d/usr/local/lib/mecab/dic/ipadic -u /path/to/userDic.dic -f utf8 -t utf8 /path/to/userDic.csv

perlで使う際はcpanにモジュールがあるけどインストールで必ずこけるの要注意。
これは後日。

これとタグクラウドを組み合わせたら最近流行りのものが作れそう。

大阪のWEB屋です。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です