[NLP] 자연어 처리/[NLP] 전처리
2021. 1. 22.
[NLP] 전처리 - 1
김기현의 자연어 처리 딥러닝 캠프 - 파이토치편 kh-kim.gitbook.io 자연어 처리 공부를 위해 해당 책을 선정하였으며, 책을 메인으로 공부하며 구글링과 함께 정리를 한 게시글입니다. 코퍼스란? '말뭉치'라고도 불리며 보통 여러 단어들로 이루어진 문장을 코퍼스(corpus)라고 합니다. 단일 언어 코퍼스(monolingual corpus) : 한 가지 언어로 구성된 코퍼스 이중 언어 코퍼스(bilingual corpus) : 두 가지 언어로 구성된 코퍼스 다중 언어 코퍼스(multilingual corpus) : 세 가지 이상의 언어로 구성된 코퍼스 병렬 코퍼스(parallel corpus) : 언어 간에 쌍으로 구성된 코퍼스 (언어 간의 번역, 대조 분석에 활용) NLP 모델을 학습을 하기 위..