【懒人必备】【增加组间显著性标记】R批量完成均值和SD计算,并以mean±SD的格式批量导出到EXCEL

更新项目

在上一篇文章【懒人必备】【增加P值输出】R批量完成均值和SD计算,并以mean±SD的格式批量导出到EXCEL的基础上,增加了事后检验及各组间差异字母的标注

注意事项

  1. 本代码适用于OneWay ANOVA统计方法,别的统计方法需要改代码
  2. 由于在样本量较少的情况下,OneWay ANOVA对正态性和方差齐性都不是特别敏感,因此这个代码中没有做这两步检验,直接做了ANOVA
  3. 本代码事后检验方法用的是LSD,如果需要使用其他事后检验方法,需要修改代码

数据准备

数据准备方式和【懒人必备】批量完成均值和SD计算,并以mean±SD的格式批量导出到EXCEL中一样,将数据按下表的形式整理好,自变量放在第一列,指标放在后面几列

group BW SGR CAT SOD
1 4 1.2 21 2.2
1 5 1.4 22 2.3
1 6 1.5 23 2.5
2 14 2.2 33 3.5
2 15 2.4 34 3.6
2 16 2.5 35 3.7
3 24 3.2 43 4.4
3 25 3.4 33 4.6
3 26 3.5 45 4.8

R代码

#############################################
##
## 批量求均值和SD
##
##-----------------------------------------
## Author : Cdudu
## Data   : 2019 8/24
############################################
library(readxl)
library(agricolae) #事后检验需要用到的包

# 读入需要统计的数据表
dat<-read_excel('Data.xls')
dat$group<-as.factor(dat$group) #将group转化为因子型,否则会影响统计结果
summary(dat)

# 创建新表用于存放Mean,SD和P值,此处as.character()中向量长度由组数决定,
# 例如上表共三组,再加上p值,需要4行,就输入as.character(1:4)
dat2<-data.frame(t1=as.character(1:4))      

for ( i in c(2:5)){            #此处向量根据应变量的列数决定,上表应变量在2-5列,因此输入c(2:5)
  means<-tapply(dat[[i]],dat$group,mean)      #计算均值
  means<-sprintf('%.2f',round(means,2))       #改变数字可以改变Mean的小数点位数
  SD<-tapply(dat[[i]],dat$group,sd)     #计算SD
  SD<-sprintf('%.2f',round(SD,2))      #改变数字可以改变SD的小数点位数
  M.aov<-aov(dat[[i]]~group,data=dat)  #检验方差
  aov.sum<-summary(M.aov)
  pvalue<-aov.sum[[1]]$`Pr(>F)`[1]  #提取p值
  if(pvalue>0.05){
     a<-paste(means,'±',SD)
     a[4]<-'NS'
     }            #a[]中的数字根据组数决定,组数+1
  else if(pvalue>0.01){
    out <- LSD.test(M.aov, "group", p.adj="none")  #事后检验
    marker<-out$groups  
    #下面三列代码的目的是将marker按分组顺序重新排序
    row_name <- row.names(marker)
    newmarker <- data.frame(row_name,marker$groups)
    newmarker <- newmarker[order(newmarker$row_name),]
    #排序结束
    pmarker<-newmarker$marker.groups #提取marker
    a<-paste(means,'±',SD,pmarker)
    a[4]<-'*'
}
  else {
    out <- LSD.test(M.aov, "group", p.adj="none")  #事后检验
    marker<-out$groups  
    #下面三列代码的目的是将marker按分组顺序重新排序
    row_name <- row.names(marker)
    newmarker <- data.frame(row_name,marker$groups)
    newmarker <- newmarker[order(newmarker$row_name),]
    #排序结束
    pmarker<-newmarker$marker.groups #提取marker
    a<-paste(means,'±',SD,pmarker)
    a[4]<-'**'
}
  dat2[i-1]<-a       
  names(dat2)[i-1]<-names(dat[,i])
}

dat3<-t(dat2)   #行列转置

write.csv(dat3,'Mean&SD.csv')

以上就是全部代码,实际操作中只需要三步操作
1.在创建dat2时,确定dat2的行数为处理组数量+1

dat2<-data.frame(t1=as.character(1:4))

2.在for循环开头,输入应变量数量

for ( i in c(2:5)){
  1. 在if语句中,确定p值在向量a中的存放位置,也就是处理组数量+1
if(pvalue>0.05){a[4]<-'NS'}            #a[]中的数字根据组数决定,组数+1
  else if(pvalue>0.01){a[4]<-'*'}
  else {a[4]<-'**'}

EXCEL输出结果

如果是将dat3输出到EXCEL,那么表格如下

NULL V1 V2 V3 V4
BW 3±0.2a 4±0.3b 5±0.4c *
SGR 3±0.2 3±0.2 3±0.2 NS
CAT 3±0.2a 3±0.2b 3±0.2c **
SOD 3±0.2 3±0.2 3±0.2 NS

V1;V2;V3即是3个试验组,V4是p值展示,里面的数值是我瞎编的。

  • NS:p>0.05
  • *: 0.05>p>0.01
  • **: p<0.01

当然也可以将dat2输出到EXCEL,那么表格如下

NULL BW SGR CAT SOD
V1 3±0.2 3±0.2a 3±0.2a 3±0.2
V2 3±0.2 3±0.2b 3±0.2b 3±0.2
V3 3±0.2 3±0.2c 3±0.2c 3±0.2
V4 NS * ** NS

批量将标记字母设为上标

需要注意到的是,R导出到EXCEL的结果中虽然带了表示各组显著性差异的标记字母,但是这些字母的格式并没有被设定为上标。
因此需要在WORD中完成格式的设定,同样一个个修改太麻烦,推荐一个批量修改的方法,具体步骤如下

  1. 将EXCEL中的数据拷贝到WOED中
  2. 点击替换,在查找内容中输入[a-z],并勾选使用通配符


    一定要勾选使用通配符
  3. 点击替换为,然后点格式


    一定要先点替换为,再点格式
  4. 选择格式-字体-上标-确认
  5. 全部替换

大功告成

这个懒汉系列终于也算告一段落了,呼...

你可能感兴趣的:(【懒人必备】【增加组间显著性标记】R批量完成均值和SD计算,并以mean±SD的格式批量导出到EXCEL)