NLTK : Natural Language Tool Kit
자연어 처리 및 문서 분석을 제공해주는 파이썬 라이브러리입니다.
NLTK의 주요 기능은 다음과 같습니다.
- 말뭉치(corpus)
- 토큰 생성(tokenizing)
- 형태소 분석(morphological analysis)
- 품사 태깅(POS tagging)
정식 NLTK 문서입니다.
NLTK는 다양한 os를 제공하고 있으며 정식 문서를 통해 NLTK의 상세한 정보를 확인할 수 있습니다.
아나콘다에서 설치할 가상 환경을 활성화시켜준 뒤 'pip install nltk'를 입력하여 설치하면 됩니다.
python을 실행시켜 nltk 버전을 확인해보면 정상적으로 설치된 것을 알 수 있습니다.
NLTK를 원활하게 모든 기능을 사용하려면 NLTK에 필요한 data를 받아주어야 합니다.NLTK.download()를 통해 한번에 받을 수 있지만 오류가 뜰 경우 해당 GitHub로 접속해 수동으로 다운로드해야 합니다.
nltk.download()를 통해 NLTK Downloader를 불러왔다면 좌측 하단에 'Download' 버튼을 눌려 설치를 하면 됩니다.
설치가 다 되어도 anaconda prompt에서는 showing인 상태로 계속 유지되어있을 수 있습니다.
기다리시면 'True'가 뜨면서 정상적으로 설치되었다고 문구가 뜹니다.
'[NLP] 자연어 처리 > [NLP] 전처리' 카테고리의 다른 글
[NLP] 정규 표현식 - 실습(python) (0) | 2021.02.01 |
---|---|
[NLP] 전처리 - 1 (0) | 2021.01.22 |