Window PCでMeCabの辞書を追加する方法

      2016/10/20

 image
最近テキストマイニングにハマっています。

日本語のテキストマイニングではRMeCabというパッケージが便利です。

このパッケージはあらかじめ登録された辞書をもとにテキスト解析を行うので、特殊な言葉などは自分で追加する必要があります。

Windows用の情報はあまりネットに落ちていなかったので忘れないようにまとめておきます。

辞書を作る

フォーマットに従ってcsvファイルを作ります。
ファイルはC:\dataに保存します。以下のようなフォーマットにします。

工藤,1223,1223,6058,名詞,固有名詞,人名,名,*,*,くどう,クドウ,クドウ

出典: MeCab: 単語の追加方法

csvをdicファイルに変換するバッチファイルを作る

以下のバッチファイルを作ります。
ファイル名は「userdic.bat」としデスクトップにでも保存します。


echo on

cd "C:\Program Files\MeCab\bin"
mecab-dict-index.exe -d "C:\Program Files\MeCab\dic\ipadic" -u user.dic -f shift-jis -t shift-jis C:\data\user.csv
move user.dic "C:\Program Files\MeCab\dic\ipadic"

pause

作成したら、バッチファイルを実行します。

MeCabが辞書ファイルを読めるようmecabrcを編集

C:\Program Files\MeCab\etcのmecabrcを開き以下を追加します。


userdic=C:\Program Files\MeCab\dic\ipadic\user.dic

以上で終了です。
あとは、RMeCabでテキストマイニングしてみて作成した単語が反映されているかチェックしてみましょう。

参考

おすすめ記事

1
2016年買って良かったモノを紹介します!

2016年もあとわずか。毎年恒例の買って良かったモノシリーズ、2016年版を紹介 ...

2
英語ができなかった僕がバイリンガルになるまでの5つの英語上達プロセス

英語ができなかった僕がバイリンガルと呼ばれるようになるまでに経験した過程を5つに分けて紹介します。

 - 統計学 ,