AI
[부스트캠프 AI Tech] day16
전종구
2021. 2. 15. 19:35
Review
NLP
- low level 단계에선 문장을 의미별로 분해한다. stemming은 단어의 어근을 추출(의미)
- word and phrase level에선 New York Times와 같은 띄어쓰기를 포함하는 것을 하나의 고유 명사로 인식 해야한다.
- Sentence level에선 문장의 긍정,부정을 판별한다.
- Multi sentence and paragraph level에선 문장간 논리적 내포나 모순을 예측하거나 문서를 요약하거나 대화를 수행할수 있는 시스템, 독해기반의 질의 응답등 고차원의 작업을 수행한다.
텍스트마이닝
- 과거의 정보들을 빠르고 지능적으로 처리하여 키워드를 추출하거나 분석한다.
Bag of Words
- 원핫 인코딩을한다, 단어의 순서는 고려할 수 없다.
Naive Bayes Classifier
- 카테고리나 클래스를 미리 정하여 문서를 거기에 맞게 분류한다.
- 처음등장하는 단어는 분류할 수 없다.(regulation으로 해결가능)
느낀점
- 설연휴 직후라 집중이 안되었지만 열심히 들었다.
Peer Session
- 다들 연휴의 휴유증에 조금은 시달리는것 같았다. 자연어처리 관련 프로젝트(뉴스에서 title을 뽑아주는 모델)과 따로 공부한 내용에 대해 발표를 들었다.