毎度。一馬力です。
無事MacにMeCab (和布蕪)をインストールする事が出来て
「すもももももももものうち」って形態素解析していたのですが
MeCab (和布蕪)の辞書ってどこに保存されているんだ?っと気になって調べたのでメモメモ
MeCab (和布蕪)も辞書もbrewコマンドでサクッとインストールしたので インストールパスなど導入時には気にしていませんでした。
目次
MeCab (和布蕪)のパラメータをダンプするコマンド
MeCab (和布蕪)のパラメータを全て表示したい場合は
コマンド:mecab -P
iMac:~ ichibariki$ mecab -P bos-feature: BOS/EOS,*,*,*,*,*,*,*,* bos-format: config-charset: EUC-JP cost-factor: 700 dicdir: /usr/local/lib/mecab/dic/ipadic dump-config: 1 eon-format: eos-format: EOS\n eos-format-chasen: EOS\n eos-format-chasen2: EOS\n eos-format-simple: EOS\n eos-format-yomi: \n eval-size: 8 lattice-level: 0 max-grouping-size: 24 nbest: 1 node-format: %m\t%H\n node-format-chasen: %m\t%f[7]\t%f[6]\t%F-[0,1,2,3]\t%f[4]\t%f[5]\n node-format-chasen2: %M\t%f[7]\t%f[6]\t%F-[0,1,2,3]\t%f[4]\t%f[5]\n node-format-simple: %m\t%F-[0,1,2,3]\n node-format-yomi: %pS%f[7] theta: 0.75 unk-eval-size: 4 unk-format: %m\t%H\n unk-format-chasen: %m\t%m\t%m\t%F-[0,1,2,3]\t\t\n unk-format-chasen2: %M\t%m\t%m\t%F-[0,1,2,3]\t\t\n unk-format-yomi: %M iMac:~ ichibariki$
MeCabのユーザー辞書の場所を調べる
MeCab (和布蕪)のユーザー辞書の場所だけ確認できればOKであれば
iMac:~ ichibariki$ mecab -P|grep ^dicdir dicdir: /usr/local/lib/mecab/dic/ipadic iMac:~ ichibariki$
MeCabのヘルプ
参考までに,MeCab (和布蕪)のヘルプを表示するためには
コマンド:mecab -h
iMac:~ ichibariki$ mecab -h MeCab: Yet Another Part-of-Speech and Morphological Analyzer Copyright(C) 2001-2012 Taku Kudo Copyright(C) 2004-2008 Nippon Telegraph and Telephone Corporation Usage: mecab [options] files -r, --rcfile=FILE use FILE as resource file -d, --dicdir=DIR set DIR as a system dicdir -u, --userdic=FILE use FILE as a user dictionary -l, --lattice-level=INT lattice information level (DEPRECATED) -D, --dictionary-info show dictionary information and exit -O, --output-format-type=TYPE set output format type (wakati,none,...) -a, --all-morphs output all morphs(default false) -N, --nbest=INT output N best results (default 1) -p, --partial partial parsing mode (default false) -m, --marginal output marginal probability (default false) -M, --max-grouping-size=INT maximum grouping size for unknown words (default 24) -F, --node-format=STR use STR as the user-defined node format -U, --unk-format=STR use STR as the user-defined unknown node format -B, --bos-format=STR use STR as the user-defined beginning-of-sentence format -E, --eos-format=STR use STR as the user-defined end-of-sentence format -S, --eon-format=STR use STR as the user-defined end-of-NBest format -x, --unk-feature=STR use STR as the feature for unknown word -b, --input-buffer-size=INT set input buffer size (default 8192) -P, --dump-config dump MeCab parameters -C, --allocate-sentence allocate new memory for input sentence -t, --theta=FLOAT set temparature parameter theta (default 0.75) -c, --cost-factor=INT set cost factor (default 700) -o, --output=FILE set the output file name -v, --version show the version and exit. -h, --help show this help and exit.
試した環境
iMac (27-inch, Mid 2010) macOS Sierra システムのバージョン: macOS 10.12.2 (16C67) カーネルのバージョン: Darwin 16.3.0 iMac:~ ichibariki$ mecab -v mecab of 0.996