楽屋

MeCabでComeJisyoを使おう

ComeJisyoとは、医療単語を3万語ほど登録しているMeCab用の辞書です。ここではMacにインストールする場合を示します。

次のページを参考にしました。「Python3でMeCab。さらに医療辞書を追加するまで

なお、MeCabのインストールについては本記事では扱いません。「MeCabをMacにインストールする手順」を参考にどうぞ。

ComeJisyoのインストール

  1. https://ja.osdn.net/projects/comedic/から、ComeJisyoV5-1.zipをダウンロードします。
  2. 解凍してできたディレクトリ内のComeJisyoV5-1.csvの最後の2行(下記参照)を削除します。

上記は辞書の情報なので、用語とは直接関係ありません。

  1. CSVファイルは文字コードがShift-JISなので、UTF-8に変換します。
  2. ターミナルでCSVファイルのあるディレクトリに移動します。
  1. ユーザー辞書を作成します。

下記エラーがでることがあります。

その場合はCSVの中身の2,3列目(-1, -1)を、

(*, *)に変更して

コマンドを再度実行します。

できました!

Pythonで使ってみる

ComeJisyo以外を使用した場合(例:mecab-ipadic-neologd)は下記のようになりますが、

ComeJisyoだと下記のようにちゃんと1つの単語として認識されました!