毎度。一馬力です。
「すもももももももものうち」。
文脈抜きにして意味が分かったあなた。人間ですね?
そして、日本語が得意と見た!素晴らしい。
我が家のMacはだめなんです。「すもももももももものうち」。
これ,分かってくれないんです。
今回は。Macに「すもももももももものうち」を分かってもらうために
形態素解析(文章を意味を持つ最小単位に分け分けする。)してみよう!
というお話。
形態素解析をgoogle先生で調べるとMeCabという形態素解析エンジンがあるんです。
MeCab (和布蕪):オープンソース 形態素解析エンジン。
http://taku910.github.io/mecab/taku910.github.io
では早速。我が家のMacにも「すもももももももものうち」分け分けしてもらいましょう!
目次
MeCab (和布蕪)のインストールに必要なもの
MeCabのインストール方法は色々あるようですが
今回はMac用のパッケージマネージャー「Homebrew」を利用してサクッとインストールします。
前提となるソフトウェアは
の2つです。
前提ソフトウェアのインストール方法
Homebrewのインストール 1周め
HomeBrewのページ(http://brew.sh/index_ja.html)にアクセスして、インストール方法を確認します。
記載の通り
/usr/bin/ruby -e "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/master/install)"
コマンドを実行する所からスタートです。
実行するとスクリプトが動作してインストールが始まります
iMac:~ ichibariki$ /usr/bin/ruby -e "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/master/install)" ==> This script will install: /usr/local/bin/brew /usr/local/share/doc/homebrew /usr/local/share/man/man1/brew.1 /usr/local/share/zsh/site-functions/_brew /usr/local/etc/bash_completion.d/brew /usr/local/Homebrew
途中でスクリプトからsudoコマンドを入力するために
パスワードを求められます。
Press RETURN to continue or any other key to abort ==> /usr/bin/sudo /bin/chmod u+rwx /usr/local/bin /usr/local/share /usr/local/share/man /usr/local/share/man/man1 Password: ★パスワードの入力★
さらにスクリプトが進むと
Command Line Tools for Xcodeをスクリプトからインストールしに行きます
==> Searching online for the Command Line Tools ==> /usr/bin/sudo /usr/bin/touch /tmp/.com.apple.dt.CommandLineTools.installondemand.in-progress ==> Installing Command Line Tools (macOS Sierra version 10.12) for Xcode-8.2 ==> /usr/bin/sudo /usr/sbin/softwareupdate -i Command\ Line\ Tools\ (macOS\ Sierra\ version\ 10.12)\ for\ Xcode-8.2 Software Update Tool Copyright 2002-2015 Apple Inc. Downloading Command Line Tools (macOS Sierra version 10.12) for Xcode Downloaded Command Line Tools (macOS Sierra version 10.12) for Xcode Installing Command Line Tools (macOS Sierra version 10.12) for Xcode
Command Line Tools for Xcodeが導入されていない場合,またはアップデートが必要な場合
スクリプトはここで止まってしまいます。
スクリプトから目を話してデスクトップを確認すると,
下の画像のようにソフトウェアアップデートが起動しています。
Command Line Tools が前提をなりますので、アップデート(インストール)して下さい。
注意:アップデートは再起動が必要です。
アップデート完了したら再起動も忘れずに!
Homebrewのインストール 2周め
Command Line Tools のアップデートが完了したら
Homebrewのインストールの2周めです。
先程同様にスクリプトを実行していきます。
スクリプトの実行
iMac:~ ichibariki$ /usr/bin/ruby -e "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/master/install)" ==> This script will install: /usr/local/bin/brew /usr/local/share/doc/homebrew /usr/local/share/man/man1/brew.1 /usr/local/share/zsh/site-functions/_brew /usr/local/etc/bash_completion.d/brew /usr/local/Homebrew
sudo実行のためパスワード入力
Press RETURN to continue or any other key to abort ==> /usr/bin/sudo /bin/mkdir -p /Users/ichibariki/Library/Caches/Homebrew Password: ★パスワード入力
スクリプトが進んで「==> Installation successful!」が表示されれば完了です。
==> Downloading and installing Homebrew... ==> Installation successful! ==> Homebrew has enabled anonymous aggregate user behaviour analytics. Read the analytics documentation (and how to opt-out) here: https://git.io/brew-analytics ==> Next steps: - Run `brew help` to get started - Further documentation: https://git.io/brew-docs iMac:~ ichibariki$
ココまででMeCab導入の前提はクリアです。
ここからはbrewコマンドでサクサクと進んでいきます
MeCab (和布蕪)のインストール
mecab関連のパッケージを探す
ここからが本題のMeCab (和布蕪)インストールとなります。
インストールはbrewコマンドで。
パッケージマネージャーHomebrewにMeCab (和布蕪)を探してみます。
iMac:~ ichibariki$ brew search mecab mecab mecab-ipadic mecab-jumandic mecab-ko mecab-ko-dic mecab-unidic homebrew/php/php53-mecab homebrew/php/php55-mecab homebrew/php/php70-mecab homebrew/php/php54-mecab homebrew/php/php56-mecab homebrew/php/php71-mecab
mecab関連のパッケージが色々と表示されますが,今回は”mecab”をインストールします。
mecabをインストールする
インストールは簡単
で一発です。
iMac:~ ichibariki$ brew install mecab ==> Downloading https://homebrew.bintray.com/bottles/mecab-0.996.sierra.bottle.2.tar.gz ######################################################################## 100.0% ==> Pouring mecab-0.996.sierra.bottle.2.tar.gz ==> Using the sandbox 🍺 /usr/local/Cellar/mecab/0.996: 18 files, 4.2M iMac:~ ichibariki$ iMac:~ ichibariki$ iMac:~ ichibariki$
インストールが完了したので,とりあえず動かすと辞書が無いって怒られる、、、。のです。
急がばまわれです。
iMac:~ ichibariki$ mecab param.cpp(69) [ifs] no such file or directory: /usr/local/lib/mecab/dic/ipadic/dicrc iMac:~ ichibariki$
mecab-ipadicのインストール
MeCab (和布蕪)に必要な辞書をインストールしていきます。
パッケージは「mecab-ipadic」です。
コマンド: brew install mecab-ipadic
iMac:~ ichibariki$ brew install mecab-ipadic ==> Downloading https://homebrew.bintray.com/bottles/mecab-ipadic-2.7.0-20070801.sierra.bottle.tar.gz ######################################################################## 100.0% ==> Pouring mecab-ipadic-2.7.0-20070801.sierra.bottle.tar.gz ==> Caveats To enable mecab-ipadic dictionary, add to /usr/local/etc/mecabrc: dicdir = /usr/local/lib/mecab/dic/ipadic ==> Summary 🍺 /usr/local/Cellar/mecab-ipadic/2.7.0-20070801: 15 files, 50.6M iMac:~ ichibariki$ iMac:~ ichibariki$ iMac:~ ichibariki$
これでやっと「すもももももももものうち」を分かってもらえる準備が完了しました。
MeCab (和布蕪)で「すもももももももものうち」
さて念願の。Macにすもももももももものうちを分け分けして理解してもらいましょう!
mecabコマンドを動かしてみます。
mecabコマンドを入力したら。「すもももももももものうち」。
名詞の「すもも」と「もも」。助詞の「も」。を分けて理解してくれました!
賢くなったねMac君。素晴らしい!!
mecabコマンド終了するときは「Ctrl-D」です。
iMac:~ ichibariki$ mecab すもももももももものうち すもも 名詞,一般,*,*,*,*,すもも,スモモ,スモモ も 助詞,係助詞,*,*,*,*,も,モ,モ もも 名詞,一般,*,*,*,*,もも,モモ,モモ も 助詞,係助詞,*,*,*,*,も,モ,モ もも 名詞,一般,*,*,*,*,もも,モモ,モモ の 助詞,連体化,*,*,*,*,の,ノ,ノ うち 名詞,非自立,副詞可能,*,*,*,うち,ウチ,ウチ EOS iMac:~ ichibariki$
なんとかMeCab (和布蕪)で形態素解析できるようになりました。
日本語って難しい。人間ってすごいですね。
みなさんのMacもMeCab (和布蕪)で少し賢くしてみませんか?
試した環境
iMac (27-inch, Mid 2010) macOS Sierra システムのバージョン: macOS 10.12.2 (16C67) カーネルのバージョン: Darwin 16.3.0 iMac:~ ichibariki$ brew -v Homebrew 1.1.5 Homebrew/homebrew-core (git revision 06aa; last commit 2016-12-18) iMac:~ ichibariki$ mecab -v mecab of 0.996