はじめに
形態素解析エンジンであるMeCabをPythonで利用するための手順を記録する
OSにインストールする方法もあるが、ここではpythonのパッケージ管理システムpipによる環境構築を行う
実行環境
マシン:MacBook Air
チップ:Apple M3
言語:Python3.12.5
pipのバージョン:pip 24.2
MeCabのインストール
$ pip3 install mecab-python3
辞書のインストールが必要になる。
辞書の種類は複数あるが、ここではunidic-liteを選択した。
$ pip3 install unidic-lite
この2つをインストールすれば準備完了
サンプルコード実行
import MeCab
tagger = MeCab.Tagger()
print(tagger.parse('すもももももももものうち'))
「すもももももももものうち」を形態素解析するプログラム
実行結果
$ python3 test.py
すもも スモモ スモモ 李 名詞-普通名詞-一般 0
も モ モ も 助詞-係助詞
もも モモ モモ 桃 名詞-普通名詞-一般 0
も モ モ も 助詞-係助詞
もも モモ モモ 桃 名詞-普通名詞-一般 0
の ノ ノ の 助詞-格助詞
うち ウチ ウチ 内 名詞-普通名詞-副詞可能 0
EOS
おわりに
形態素解析や分かち書きについては今後色々試していく予定
参考にしたサイト
mecab-python3 · PyPI https://pypi.org/project/mecab-python3/
コメントを残す