Konlpy의 Mecab 사용자 사전 추가하기.(Mac)

먼저 해당 포스트는 아래에 있는 페이지를 참고 했으며,

mecab-ko와 mecab-ko-dic 파일이 설치되어 있는 전제로 진행해보려고 한다.

내가 해당 페이지에서 설치한 최신 파일은 “mecab-ko-dic-2.1.1–20180720”이다.

사용자 사전 추가하기

mecab-ko-dic-2.1.1–20180720 폴더에 들어가면 tools 폴더와 user-dic 폴더를 확인할 수 있다.

이 중에 user-dic 폴더를 클릭한다. 나는 mecab에서 제공되는 고유 명사 외에 ‘바이레도' 라는 새로운 고유명사를 추가하고 싶었고 nnp.csv를 통해 수정했다.

엑셀로 키게되면 글자가 깨져, 텍스트 편집기로 수정했고 ‘바이레도' 라는 향수를 새롭게 추가했다. 여기서 T,F는 종성유무인데 해당 단어에 맞게 조정하면 된다. 그 외에 문법은 아래 참조 url을 통해 확인 가능하다.

그럼 이제 터미널로 들어가보자.

  1. 해당 폴더가 있는 디렉토리로 이동한 후에
cd ./mecab-ko-dic-2.1.1-20180720

2. 아래 코드를 터미널에서 실행 시킨다.
(csv를 통해 수정한 사전을 컴파일링 시키는 과정)

./mecab-ko-dic-2.1.1-20180720/tools/add-userdic.sh

3. 그리고 마지막으로 해당 코드를 입력하면 사용자 단어 사전에 ‘바이레도'가 추가 된다. (기존에는 [‘바이’,’레도’] 로 분리되어 나왔다.)
(설치를 끝내는 과정, 해당 과정을 끝내야 jupyter notebook에서 활용 가능)

make install
  • 혹시 만약에 make install 과정에서 permission denied 에러가 난다면 다음과 같이 따라하면 된다.
make install DESTDIR=/tmp/myinst/sudo cp -va /tmp/myinst/ /

make install의 권한을 해제하는 코드인데, 해당 코드를 작성하면 권한 오류가 나지 않고 정상적으로 작동한다.

마찬가지로 nnp 이외에도 인물이나 장소 등을 추가시킬 수 있으므로 유용하게 활용할 수 있을 것 같다.

요약

  1. cd ./mecab-ko-dic-2.1.1–20180720 터미널 입력
  2. mecab-ko-dic-2.1.1–20180720/user-dic 에 있는 csv에 단어 추가
  3. ./mecab-ko-dic-2.1.1–20180720/tools/add-userdic.sh 터미널 입력
  4. make install 터미널 입력
  5. terminal 혹은 jupyter 등 원하는 작업환경에서 테스트

참조

https://docs.google.com/spreadsheets/d/1-9blXKjtjeKZqsf4NzHeYJCrr49-nXeRF6D80udfcwY/edit#gid=6

기술적인 성장을 희망합니다

Get the Medium app

A button that says 'Download on the App Store', and if clicked it will lead you to the iOS App store
A button that says 'Get it on, Google Play', and if clicked it will lead you to the Google Play store