본문 바로가기

[NLP] 자연어 처리/[NLP] 전처리

[NLP] NLTK, NLTK data 설치


NLTK : Natural Language Tool Kit

자연어 처리 및 문서  분석을 제공해주는 파이썬 라이브러리입니다.

 

NLTK의 주요 기능은 다음과 같습니다.

  • 말뭉치(corpus)
  • 토큰 생성(tokenizing)
  • 형태소 분석(morphological analysis)
  • 품사 태깅(POS tagging)

 

Installing NLTK — NLTK 3.5 documentation

Installing NLTK NLTK requires Python versions 3.5, 3.6, 3.7, or 3.8 For Windows users, it is strongly recommended that you go through this guide to install Python 3 successfully https://docs.python-guide.org/starting/install3/win/#install3-windows Mac/Unix

www.nltk.org

정식 NLTK 문서입니다.

NLTK는 다양한 os를 제공하고 있으며 정식 문서를 통해 NLTK의 상세한 정보를 확인할 수 있습니다.

 

아나콘다에서 설치할 가상 환경을 활성화시켜준 뒤 'pip install nltk'를 입력하여 설치하면 됩니다.

 

python을 실행시켜 nltk 버전을 확인해보면 정상적으로 설치된 것을 알 수 있습니다.


 

nltk/nltk_data

NLTK Data. Contribute to nltk/nltk_data development by creating an account on GitHub.

github.com

NLTK를 원활하게 모든 기능을 사용하려면 NLTK에 필요한 data를 받아주어야 합니다.NLTK.download()를 통해 한번에 받을 수 있지만 오류가 뜰 경우 해당 GitHub로 접속해 수동으로 다운로드해야 합니다.

 

 

nltk.download()를 통해 NLTK Downloader를 불러왔다면 좌측 하단에 'Download' 버튼을 눌려 설치를 하면 됩니다.

 

설치가 다 되어도 anaconda prompt에서는 showing인 상태로 계속 유지되어있을 수 있습니다.

 

기다리시면 'True'가 뜨면서 정상적으로 설치되었다고 문구가 뜹니다.


'[NLP] 자연어 처리 > [NLP] 전처리' 카테고리의 다른 글

[NLP] 정규 표현식 - 실습(python)  (0) 2021.02.01
[NLP] 전처리 - 1  (0) 2021.01.22