
library(tidyverse)
library(caret)
library(rpart)
library(VIM)
library(car)
library(naniar)
library(mice)
library(ggthemes)
dat <- read.csv('titanic.csv')
nrow(dat)
以下程序分析数据集中缺失的数据。
sapply(dat, function(x) round(sum(is.na(x)),2))
aggr(dat, prop=FALSE, numbers=TRUE)
dat %>%
miss_var_summary() %>%
head()

统计数据集的缺失值
对缺失值非常严重的无