R语言存在NA的p-value计算

Summary:t.test计算存在NA值的data时,默认的mean格式为mean(x, na.rm=TRUE),

也就是每组的NA不计入每组的个数中。

验证:

1. data 如下:

Fig 1. data预览

2. 在NA存在的条件下直接计算p.value

group<-factor(rep(c("M","C"),c(40,20)))

t.test(as.numeric(test)~group)

Fig 2. NA存在条件下直接计算p.value

t.test(as.numeric(test)~group)$p.value,可以直接提取p-value;

t.test(as.numeric(test)~group)$estimate[1], 可以直接提取相应的mean值;

3. 去掉NA值计算p.value

mm<-test[c(5:20,24:40,44:60)] 

group1<-factor(rep(c("M","C"),c(33,17))) 

t.test(as.numeric(mm)~group1)

Fig 3. NA全部去除


Fig 4.重新计算p.value

可以看出两种计算相同,以后可以放心的计算含有NA值的数据啦!

你可能感兴趣的:(R语言存在NA的p-value计算)