【懒人必备】【增加P值输出】R批量完成均值和SD计算,并以mean±SD的格式批量导出到EXCEL

上一篇文章【懒人必备】批量完成均值和SD计算,并以mean±SD的格式批量导出到EXCEL推出后,有小伙伴希望可以在最后一列增加p值输出。

改进后的代码

注意事项

  1. 本代码用的是OneWay ANOVA的统计方法,别的统计方法需要改代码
  2. 由于在样本量较少的情况下,OneWay ANOVA对正态性和方差齐性都不是特别敏感,因此这个代码中没有做这两步检验,直接做了ANOVA
  3. 目前的代码没有做事后检验,如果需要事后检验,并且批量在各个数据上显示上标字母的话,请留言

数据准备

数据准备方式和【懒人必备】批量完成均值和SD计算,并以mean±SD的格式批量导出到EXCEL中一样

group BW SGR CAT SOD
1 4 1.2 21 2.2
1 5 1.4 22 2.3
1 6 1.5 23 2.5
2 14 2.2 33 3.5
2 15 2.4 34 3.6
2 16 2.5 35 3.7
3 24 3.2 43 4.4
3 25 3.4 33 4.6
3 26 3.5 45 4.8

R代码

#############################################
##
## 批量求均值和SD
##
##-----------------------------------------
## Author : Cdudu
## Data   : 2019 8/14
############################################
library(readxl)

# 读入需要统计的数据表
dat<-read_excel('Data.xls')
dat$group<-as.factor(dat$group) #将group转化为因子型,否则会影响统计结果
summary(dat)

# 创建新表用于存放Mean,SD和P值,此处as.character()中向量长度由组数决定,
# 例如上表共三组,再加上p值,需要4行,就输入as.character(1:4)
dat2<-data.frame(t1=as.character(1:4))      

for ( i in c(2:5)){            #此处向量根据应变量的列数决定,上表应变量在2-5列,因此输入c(2:5)
  means<-tapply(dat[[i]],dat$group,mean)
  means<-sprintf('%.2f',round(means,2))       #改变数字可以改变Mean的小数点位数
  SD<-tapply(dat[[i]],dat$group,sd)
  SD<-sprintf('%.2f',round(SD,2))      #改变数字可以改变SD的小数点位数
  a<-paste(means,'±',SD)
  M.aov<-aov(dat[[i]]~group,data=dat) 
  aov.sum<-summary(M.aov)
  pvalue<-aov.sum[[1]]$`Pr(>F)`[1]
  if(pvalue>0.05){a[4]<-'NS'}            #a[]中的数字根据组数决定,组数+1
  else if(pvalue>0.01){a[4]<-'*'}
  else {a[4]<-'**'}
  dat2[i-1]<-a       
  names(dat2)[i-1]<-names(dat[,i])
}

dat3<-t(dat2)   #行列转置

write.csv(dat3,'Mean&SD.csv')

以上就是全部代码,实际操作中只需要三步操作
1.在创建dat2时,确定dat2的行数为处理组数量+1

dat2<-data.frame(t1=as.character(1:4))

2.在for循环开头,输入应变量数量

for ( i in c(2:5)){
  1. 在if语句中,确定p值在向量a中的存放位置,也就是处理组数量+1
if(pvalue>0.05){a[4]<-'NS'}            #a[]中的数字根据组数决定,组数+1
  else if(pvalue>0.01){a[4]<-'*'}
  else {a[4]<-'**'}

结果展示

如果最后是将dat3输出到EXCEL,那么表格如下

NULL V1 V2 V3 V4
BW 3±0.2 4±0.3 5±0.4 *
SGR 3±0.2 3±0.2 3±0.2 NS
CAT 3±0.2 3±0.2 3±0.2 **
SOD 3±0.2 3±0.2 3±0.2 NS

V1;V2;V3即是3个试验组,V4是p值展示,里面的数值是我瞎编的。

  • NS:p>0.05
  • *: 0.05>p>0.01
  • **: p<0.01

当然也可以将dat2输出到EXCEL,那么表格如下

NULL BW SGR CAT SOD
V1 3±0.2 3±0.2 3±0.2 3±0.2
V2 3±0.2 3±0.2 3±0.2 3±0.2
V3 3±0.2 3±0.2 3±0.2 3±0.2
V4 NS * ** NS

你可能感兴趣的:(【懒人必备】【增加P值输出】R批量完成均值和SD计算,并以mean±SD的格式批量导出到EXCEL)