Windows で MeCab のユーザー辞書をコマンドから作成する
MeCab のユーザー辞書を作成する方法です。ユーザー辞書を作成するための CSV を作成し、mecab-dict-index.exe を叩くだけです。MeCab がインストールされている必要があります。
単語の追加方法
https://taku910.github.io/mecab/dic.html
以下のフォーマットの CSV を作成します。
エンコードは UTF-8 とします(Excel から出力すると UTF-8 にならないので注意)。
それぞれの列は、以下のようなフォーマットです。
詳細は単語の追加方法のページに記載されています。
※ CSV の置き場所は適当で良いですが、このサンプルでは「C:\temp」に置いています。
※ MeCab のインストールフォルダは環境により変わります。ここでは「C:\Program Files (x86)」を想定しています。
echo on
cd "C:\Program Files (x86)\MeCab\bin"
mecab-dict-index.exe -d "C:\Program Files (x86)\MeCab\dic\ipadic" -u user.dic -f utf-8 -t utf-8 C:\temp\user.csv
move user.dic "C:\temp\"
pause
C:\temp フォルダに、user.dic が作られます。
ユーザー辞書用の CSV 作成
単語の追加方法
https://taku910.github.io/mecab/dic.html
以下のフォーマットの CSV を作成します。
エンコードは UTF-8 とします(Excel から出力すると UTF-8 にならないので注意)。
工藤,1223,1223,6058,名詞,固有名詞,人名,名,*,*,くどう,クドウ,クドウ
それぞれの列は、以下のようなフォーマットです。
詳細は単語の追加方法のページに記載されています。
表層形,左文脈ID,右文脈ID,コスト,品詞,品詞細分類1,品詞細分類2,品詞細分類3,活用形,活用型,原形,読み,発音
バッチファイルを作成
こんな感じのバッチファイルを用意します。※ CSV の置き場所は適当で良いですが、このサンプルでは「C:\temp」に置いています。
※ MeCab のインストールフォルダは環境により変わります。ここでは「C:\Program Files (x86)」を想定しています。
echo on
cd "C:\Program Files (x86)\MeCab\bin"
mecab-dict-index.exe -d "C:\Program Files (x86)\MeCab\dic\ipadic" -u user.dic -f utf-8 -t utf-8 C:\temp\user.csv
move user.dic "C:\temp\"
pause
C:\temp フォルダに、user.dic が作られます。