본문바로가기


페이지 위치

블로그

Home 블로그

블로그






[NLP자연어처리]

시즌3 NLP : 피처 추출과 피처 엔지니어링

  • 2022-02-28   의견나누기 0

[ 시즌3 : NLP 003회 ]

 

2022년 2월 28일 월요일

 

회사 세미나 시즌3

주제는 NLP(자연어처리)이다.

 

2월부터 시작했다.

매주 월요일마다 했다.

세 번째 시간을 가졌다.

오전 9시 30분부터 11시까지 진행했다.

직원들이 교대로 발표를 한다.

3월부터는 격주로 할 예정이다.

 

외부에서도 줌으로 참석한다.

대전에 있는 연구원의 책임연구원 1명,

대학교 교수 1명, 해당 대학원생 1명이다.

 

오늘 내용은 다음과 같다.

1. 텍스트에서 피처 추출

1.1 원시 텍스트에서 일반적인 피처 추출

1.2 단어 모음

1.3 지프의 법칙

1.4 TF-IDF

 

2. 피처 엔지니어링

2.1 텍스트 유사도 : 코사인 유사도, 자카드 유사도

2.2 단어 구름

2.3 다른 시각화 방법들

Comment 0

닉네임과 이메일은 현재 사용기기에 저장되어 다음부터 편리하게 글을 공유할 수 있습니다.



빠른메뉴



페이지 맨 위로 이동