ANOVA, Multiple comparison, Orthogonal contrast (1)

      最近文章被拒,原因是使用了错误的统计方法。我在文章中使用的是One-Way ANOVA,而编辑指出应该改用Orthogonal contrast才更合适。对于单因素实验设计,One-Way ANOVA(即单因素方差分析)是很常用的一种检测显著性的方法。而在我身边,这种常用已经有发展为滥用的趋势,一些小伙伴只要见到单因素试验设计,拿来就是一套One-Way,更有甚者将双因素试验拆开做两个One-Way。正所谓“万物皆可One-Way”.....

      先来看一下我说的这套One-Way ANOVA的流程,百度中搜索“SPSS 单因素方差分析”,即可看到如下流程:

1、打开SPSS,输入数据

2、选择One-Way ANOVA

3、将自变量和应变量放入对应的框中

Fig1 图片来自百度经验

4、点Post Hoc选项,选择一种比较方法,通常是LSD, Bonferroni,Duncan等

Fig2 图片来自百度经验

5、运行后查看结果,首先需要看ANOVA的结果,P值是否<0.05

Fig3 图片来自百度经验

6、如果ANOVA的P值<0.05, 则继续看Post Hoc的检测结果,在同一栏里的组没有显著性差异,在不同栏里的组存在显著性差异。

Fig4 图片来自百度经验

      相信很多小伙伴对这套流程并不陌生,但是需要说明的是,由于SPSS对功能进行了整合,其实这套流程里包括了三个步骤

      1、方差齐性检验

      2、ANOVA

      3、Post Hoc Multiple comparison (事后检验,多重比较法)


      来看一下用R怎么实现以上三个步骤

      1、导入数据

    library(readxl) #第一次使用readxl包前需要安装     

    example<-read_excel('OneWay ANOVA范例.xlsx')   #这里我编了一个名字叫OneWay ANOVA范例的excel表,内容如下

Fig5 OneWay ANOVA范例.xlsx

      2、方差齐性检验,按标准流程其实还应该做正态性检验,但是由于One-Way ANOVA对正态性并不敏感,因此省略了。

      library(car)                           

      leveneTest(BW~group,data=example)      #Levene's Test检验,p>0.05则方差齐

      3、当方差齐时,进行ANOVA

      BW.aov<-aov(BW~group,data=example)      #ANOVA分析

      summary(BW.aov)                                        #Summary

      One-Way ANOVA 其实只有这两行代码,他的输出结果类似Fig3。当One-Way ANOVA检测到组间存在显著性差异后,则需要进一步搞清楚差异来自哪里

      4、Post Hoc Multiple comparison

      BW_posthoc<-TukeyHSD(BW.aov)              #TukeyHSD事后检验

      BW_posthoc                                #输出TukeyHSD分析结果

      此处我用的是TukeyHSD,当然也可以改用别的多重比较方法。


      可以看到,SPSS中的One-Way 流程其实包括了One-Way ANOVA Multiple comparison两个分析。我身边的一些小伙伴往往把他们视作一个统一的流程,只要是单因素试验,打开SPSS就按这个流程来。但是事实上, Multiple comparison并不适用于所有的单因素试验,只有当试验设计为非计划的(unplanned)时,才可以使用 Multiple comparison。 而如果你的试验设计为事先计划好的(planned),则应该选择Orthogonal contrast进行后续分析。

总结一下,One-Way ANOVA的正确流程

1、判断方差齐性

2、方差齐的情况下,进行ANOVA分析

3、如果ANOVA分析的P值<0.5,认为存在显著性差异,需要进行进一步分析

4、如果试验是unplanned,选择 Multiple comparison

    如果试验是planned,选择Orthogonal contrast


一点小吐槽

      关于文章被拒稿这件事,其实在写文章时也考虑过ANOVA+Multiple comparison的统计方法是否合适。我去下载了一篇打算投稿的杂志今年刚发的文章,试验设计与我一样,统计方法采用的就是ANOVA+Multiple comparison,似乎这样也是可以发表的嘛。加上以之前读文献的经验来看,我目前所在的领域似乎对统计方法是否科学并没那么关注,于是就偷懒用了ANOVA+Multiple comparison。然后就杯具了.....

      在得知由于统计方法的原因被拒后,就对该杂志最近5期的所有文献进行了搜索,挑出了试验设计和我相同的文章,查看了他们的统计方法,结果发现Multiple comparison和Orthogonal contrast基本上是对半开的,还有一些则两种方法同时用上了。所以这就证明:统计方法用错了,也不是百分百会被拒稿,否则已发表的文章都该是Orthogonal contrast的方法。那么,问题就来了:为什么我被拒稿了?

      为了搞清楚这个问题,也为了顺便锻炼一下我的数据处理能力,我打算开展以下研究(有时间的话):

    1、 尽量搜集更多该杂志上和我试验设计一样的文章,然后获得文章的各种信息:例如作者国籍,作者的科研界地位(可以量化成文章数量、IF、被引次数等等),投稿月份等等。

    2、尝试做一个PCA分析,看看能否将采用了不同统计方法的文章在PCA图上分开。

    3、假如可以的话,进一步挑出关键因子。

    想来这样就可以知道我被拒稿的真正原因了...emmmmm(认真脸ಠ_ಠ)

你可能感兴趣的:(ANOVA, Multiple comparison, Orthogonal contrast (1))