본문바로가기


페이지 위치

블로그

Home 블로그

블로그






[이부일의 칼럼] 리스트

블로그
제목 등록일
[이부일의 칼럼]  결측치를 처리하라  (0) 2022-10-19
[이부일의 칼럼]  데이터 기반  (0) 2022-07-27
[이부일의 칼럼]  데이터에 기반한 문제 해결형 강의  (0) 2022-02-25
[이부일의 칼럼]  대전환의 시기 : 대전의 정체성은 무엇인가?  (0) 2022-02-23
[이부일의 칼럼]  대전을 인공지능 또는 데이터의 중심으로  (0) 2022-02-23
[이부일의 칼럼]  데이터를 분석한다는 것은?  (0) 2022-01-28
[이부일의 칼럼]  AI 시대, 누가 인재인가? : 1편  (0) 2022-01-21

[이부일의 칼럼]

결측치를 처리하라

  • 2022-10-19   의견나누기0

지난 주, 금요일 오후 4시.

어떤 회사에게 자문을 해 주었다.

 

결측치(결측값, Missing Value)를 대체(Imputation)하는 방법론이었다.

 

범주형 자료일 때,

수치형 자료일 때,

각각 구분하여 소개했다.

 

1. 그냥 쓴다.

2. 삭제한다(행기준, 열기준)

3. 대체한다(최빈수, 평균, 절사평균, 중위수, 특정값, 이전값, 이후값, 핫덱, 회귀식, kNN, XGBoost, 시계열 등등)

 

전력 데이터를 수집하는 과정에서 발생한

결측치를 처리하기 위해 알지 못하는, 새로운 방법이 있는지를 자문했고, 여러 방법론을 소개드렸다.

 

데이터를 분석하는 과정에서 운명처럼 만나게 되는 결측치 그리고 결측치를 처리하는 방법.

데이터 관련 교육을 하는 곳에서는 데이터 전처리 과정을 꼭 강의해야 한다고 생각한다. 대학교의 현장에서도, 전문 데이터 분석 기관에서도.

 

정말 배울 것이 많다.

고민할 것도 많다.

 

자문을 하는 과정에서 나도 배울 수 있었다.

자문에 초대해 주신 대표님께 감사하다.

빠른메뉴



페이지 맨 위로 이동