본문바로가기


페이지 위치

블로그

Home 블로그

블로그






[이부일의 칼럼]

결측치를 처리하라

  • 2022-10-19   의견나누기 0

지난 주, 금요일 오후 4시.

어떤 회사에게 자문을 해 주었다.

 

결측치(결측값, Missing Value)를 대체(Imputation)하는 방법론이었다.

 

범주형 자료일 때,

수치형 자료일 때,

각각 구분하여 소개했다.

 

1. 그냥 쓴다.

2. 삭제한다(행기준, 열기준)

3. 대체한다(최빈수, 평균, 절사평균, 중위수, 특정값, 이전값, 이후값, 핫덱, 회귀식, kNN, XGBoost, 시계열 등등)

 

전력 데이터를 수집하는 과정에서 발생한

결측치를 처리하기 위해 알지 못하는, 새로운 방법이 있는지를 자문했고, 여러 방법론을 소개드렸다.

 

데이터를 분석하는 과정에서 운명처럼 만나게 되는 결측치 그리고 결측치를 처리하는 방법.

데이터 관련 교육을 하는 곳에서는 데이터 전처리 과정을 꼭 강의해야 한다고 생각한다. 대학교의 현장에서도, 전문 데이터 분석 기관에서도.

 

정말 배울 것이 많다.

고민할 것도 많다.

 

자문을 하는 과정에서 나도 배울 수 있었다.

자문에 초대해 주신 대표님께 감사하다.

Comment 0

닉네임과 이메일은 현재 사용기기에 저장되어 다음부터 편리하게 글을 공유할 수 있습니다.



빠른메뉴



페이지 맨 위로 이동