데이터 분석/R

R에서 결측치 확인하고 대치(impute)하기

세리둥절 2021. 12. 7. 21:21
반응형

✔️ 필요성

데이터를 확인할 때 다른 것보다 우선적으로 결측치를 확인하고 적절한 값으로 대치하는 것은 너무나 중요합니다.

 

 

✔️ 결측치 확인하기

#데이터셋 전체에 대해서 결측치 확인하기
sum(is.na(dataset))

 

✔️ 결측치 삭제하기

# 결측치 있는 행 삭제
dataset_without_na = na.omit(dataset)

 

✔️ 결측치 대치(impute)하기

# dplyr 활용하기
data_impute = data %>% mutate(col = ifelse(is.na(col), 0, col))


# replace_na 활용해서 1개 컬럼 impute
data_impute = data %>% mutate(col = replace_na(col, 0))
 

# replace_na 활용해서 2개 이상 컬럼 impute
data_impute = data %>% replace_na(list(x = 0, y = "NA"))

 

반응형