본문 바로가기

AI

[부스트캠프 AI Tech] day16

Review


NLP

  • 자연어를 처리
  • low level 단계에선 문장을 의미별로 분해한다. stemming은 단어의 어근을 추출(의미)
  • word and phrase level에선 New York Times와 같은 띄어쓰기를 포함하는 것을 하나의 고유 명사로 인식 해야한다.
  • Sentence level에선 문장의 긍정,부정을 판별한다.
  • Multi sentence and paragraph level에선 문장간 논리적 내포나 모순을 예측하거나 문서를 요약하거나 대화를 수행할수 있는 시스템, 독해기반의 질의 응답등 고차원의 작업을 수행한다.

텍스트마이닝

  • 과거의 정보들을 빠르고 지능적으로 처리하여 키워드를 추출하거나 분석한다.

Bag of Words

  • 원핫 인코딩을한다, 단어의 순서는 고려할 수 없다.

Naive Bayes Classifier

  • 카테고리나 클래스를 미리 정하여 문서를 거기에 맞게 분류한다.
  • 처음등장하는 단어는 분류할 수 없다.(regulation으로 해결가능)

느낀점

  • 설연휴 직후라 집중이 안되었지만 열심히 들었다.

Peer Session

  • 다들 연휴의 휴유증에 조금은 시달리는것 같았다. 자연어처리 관련 프로젝트(뉴스에서 title을 뽑아주는 모델)과 따로 공부한 내용에 대해 발표를 들었다.

'AI' 카테고리의 다른 글

[부스트캠프 AI Tech] day18  (0) 2021.02.17
[부스트캠프 AI Tech] day15  (0) 2021.02.05
[부스트캠프 AI Tech] day13  (0) 2021.02.03
[부스트캠프 AI Tech] day 12  (0) 2021.02.02
[부스트캠프 AI Tech] day11  (0) 2021.02.01