728x90
반응형

데이터 분석 6

R ggplot에서 for문 활용해서 세로선 추가하기

✔️ 필요성 ggplot으로 x축이 날짜인 그래프를 그렸다. 그리고 내가 원하는 특정 날짜마다 포인트를 주기 위해서 세로선을 그리고 싶다. 그런데 일일이 날짜를 계산해서 geom_vline을 추가하려니 힘들다. for loop을 활용해보자. ✔️ 활용 예제 # 그림 그리기 p = data %>% mutate(time = ymd(dt)) %>% ggplot() + geom_line(aes(x=time, y=cnt, group=region)) + facet_wrap(~region, scales='free_x') + theme_bw() + theme(legend.position = 'top') + xlab('') + ylab('') + scale_y_continuous(labels = scales::comma..

데이터 분석/R 2021.12.07

R에서 결측치 확인하고 대치(impute)하기

✔️ 필요성 데이터를 확인할 때 다른 것보다 우선적으로 결측치를 확인하고 적절한 값으로 대치하는 것은 너무나 중요합니다. ✔️ 결측치 확인하기 #데이터셋 전체에 대해서 결측치 확인하기 sum(is.na(dataset)) ✔️ 결측치 삭제하기 # 결측치 있는 행 삭제 dataset_without_na = na.omit(dataset) ✔️ 결측치 대치(impute)하기 # dplyr 활용하기 data_impute = data %>% mutate(col = ifelse(is.na(col), 0, col)) # replace_na 활용해서 1개 컬럼 impute data_impute = data %>% mutate(col = replace_na(col, 0)) # replace_na 활용해서 2개 이상 컬럼 ..

데이터 분석/R 2021.12.07
728x90
반응형