MICE는 Multivariate Imputation By Chained Equations 알고리즘을 의미한다.

이 기술은 다른 열의 데이터를 보고 각 누락된 값에 대한 최상의 예측을 추정하여 데이터 세트의 누락된 값을 쉽게 대체할 수 있는 기술이다.

예시 - 은행가가 개인 대출을 받기 위해 사람들에게 접근

수집된 정보에는 사람의 나이, 경험, 급여, 이 은행원을 통해 개인 대출을 받았는지 여부가 존재

Untitled

Goal: 은행원은 자신이 수집한 데이터를 사용하여 더 많은 사람들이 개인 대출을 신청할 수 있도록 어떤 사람들에게 접근하고 싶어함

누락된 값의 실제 데이터

Untitled

반복 1:

1단계: 각 열의 평균으로 평균 대치를 사용하여 모든 결측값을 대치한다. - “제로스(Zeroth)” 데이터 세트

Untitled

2단계: "연령" 귀속 값을 제거하고 다른 열의 귀속 값을 유지합니다.

Untitled