imputation (1) 썸네일형 리스트형 랜덤포레스트 모델의 결측값 대체 방법 다양한 설문조사 데이터를 통한 응답자의 백신 접종 여부를 예측하는 데이터셋의 처리를 배우면서, 설문지 응답의 20-30% 정도를 차지하는 결측치를 잘 대체할 수 있는 방법이 있을까 찾아봤다. 중앙값 대체(median imputation) 결측값을 해당 변수들의 중위수로 대체 평균 대체법과 동일한 단점(분포 왜곡) 존재 예측 평균 일치 대체 (Predictive Mean Matching Imputation, PMM) 결측치를 회귀모형에 의해 가장 가까운 관측값에 일치시키는 방법 선형 회귀 분석의 변형된 형태 관측값에 대한 예측값-결측값에 대한 예측값의 차이가 작은 개체들의 자료값으로 결측값을 대체 랜덤 포레스트와 결합할 경우, 가장 민감도 결과가 좋았다. K-Nearest Neighbors Imputati.. 이전 1 다음