R第十一天

一、缺失值显示

缺失值符号  NA

data()——查看内置数据集

my_data <- edit(my_data)——编辑数据集

my_data[-(1:5),1] <- NA——第一列除了前5行都为缺失值

a <- is.na(mydata)——查看哪些位置上是缺失值

sum(a[,1])——查看第一列缺失值个数

mean(a[,1])——查看第一列缺失值比列,或用上一个除以nrow(my_data)

apply(a,2,mean)——查看每列缺失值比列,1是行,2是列 返回的是向量,可以通过元素的名字访问元素

which(a,arr.ind =T)——返回a中对应T所在位置

complete.cases(mydata)——True表示相应的行是完整的数据

mean(!complete.cases(mydata))——返回缺失行的比列,记得前面加!T和F对调一下

二、mice包

md.pattern(mydata)——最后一列是几个变量有缺失值,第一列这种缺失模式有几个观测值,最后一行是总的情况,图形可视化,红色表示相应缺失模式

三、缺失值处理

删除缺失值多的变量——缺失值太多才能删变量

na.omit(mydata  或者用complete。cases函数——删除缺失值的行

mean(mydata[,1],na.rm=T)——对第一列去掉缺失值取平均数

缺失值插补

你可能感兴趣的:(R第十一天)