MeCabで集合知プログラミングのサンプルコードを日本語対応

MeCabを使って集合知プログラミングという書籍のサンプルコードの日本語対応をしてみた.書籍でも日本語対応について書かれてるけど,Yahoo!形態素解析が使われてるんでレスポンスが悪い.大量のデータを用いて分類機とかの性能を評価するには不向きなので,MeCabでやれば良い.残念ながら落ちてる車輪が見つからんかったから自分で実装した.


bitbucketで公開
hirokiky / pci_chap6 / source / mecabsplitter.py — Bitbucket

使うにはMeCabpython-mecabが必要.

$ sudo apt-get install mecab python-mecab

apt-getがあればこれだけでいけると思う.

使い方はyahoosplitter.pyと同じ.mecabsplitter.pyって名前で作ったから

>>>#import yahoosplitter as splitter
>>>import mecabsplitter as splitter

置き換えるだけで使えると思う.