반응형
✔️ 필요성
데이터를 확인할 때 다른 것보다 우선적으로 결측치를 확인하고 적절한 값으로 대치하는 것은 너무나 중요합니다.
✔️ 결측치 확인하기
#데이터셋 전체에 대해서 결측치 확인하기
sum(is.na(dataset))
✔️ 결측치 삭제하기
# 결측치 있는 행 삭제
dataset_without_na = na.omit(dataset)
✔️ 결측치 대치(impute)하기
# dplyr 활용하기
data_impute = data %>% mutate(col = ifelse(is.na(col), 0, col))
# replace_na 활용해서 1개 컬럼 impute
data_impute = data %>% mutate(col = replace_na(col, 0))
# replace_na 활용해서 2개 이상 컬럼 impute
data_impute = data %>% replace_na(list(x = 0, y = "NA"))
반응형
'데이터 분석 > R' 카테고리의 다른 글
R ggplot에서 양쪽에 y축 만들기 (0) | 2023.08.24 |
---|---|
R ggplot에서 배경 라인 없애기 (0) | 2021.12.07 |
R ggplot에서 츄파츕스 차트 그리기 / geom_segment (0) | 2021.12.07 |
R에서 위경도 간의 거리(dist) 구하기 (0) | 2021.12.07 |
R ggplot에서 for문 활용해서 세로선 추가하기 (0) | 2021.12.07 |