方差分析与实验设计

很多实验设计都是基于方差分析的思想,通过严格的设计,找出其中哪个因素会对实验结果造成影响,或者哪个因素对结果的影响更大。你可能听说过很多方差分析类型,如单因素方差分析、析因设计的方差分析、交叉设计的方差分析等。其实它们的思想都是相同的,唯一不同的是设计的因素多少,当然有的可能还需要考虑层级关系等

1.单因素方差分析

单因素方差分析是最简单的,只有一个因素,根据这个因素的水平数将其分为多个组。 此时“模型”就是指该分析因素,所以结果中的模型自由度就是水平数—1

2.析因设计的方差分析

析因设计是多因素设计,可在设计中加入多个因素,不仅可以考查各因素的单独效应,还可以考查因素之间的交互效应。 ​ 是否采用析因设计往往跟你的研究目的有关系。例如,想了解A 、B两种药物治疗高血压的疗效,如果你的目的是比较这两种药物的疗效差异,那么此时“药物”是一个因素,而药物的A、B类是因素的两个水平。但如果你的目的不是单纯地比较这两种药物的疗效差异,而是还想关注这两种药物联合服用会不会效果更好,那就可以采用析因设计。此时是把两种药物各自作为一个因素,药物A有两个水平(服用和不服用),药物B也有两个水平(服用和不服用),这时析因设计就是下图的4种组合。

dSyGO1.png

在单因素设计中,只能分析不同水平之间的差异;而在析因设计中,不仅可以分析每个因素各水平之间的差异,还可以分析多个因素之间的交互效应(Interaction) 。所谓交互效应,是指产生了1+1≠2这样的结果

交互效应:不是说同时使用A和B的效果优于单独使用A或者B时,就认为其存在正向交互效应,因为,假如在理论上能够产生的效果为A+B=7,只有当A+B>7时,才能说明存在正向交互效应。

含交互项的多因素方差分析的变异分解过程如下。总的来说,仍将总变异分为模型和误差两部分,但此处的“模型”不是一个因素,而是一个包含了A、B、AB三个因素的模型。因此,从图中可以发现,模型的离均差平方和为886.2, 它又继续分为三个部分:A=661.5,B=170.7, C=54.0

dSyDld.png

从图中还可以看出, A因素解释的变异最大,说明A因素对结果的影响最大;A*B 有统计学意义(P=0.0171),说明A和B之间可能存在交互效应。当然具体的交互效应(是正向还是负向)需要结合实际情况来看。

统计软件中创建的Type 3平方和(Ⅲ型平方和)和Type 1平方和(Ⅰ型平方和)分别代表什么意思?

Ⅲ型平方和:是指矫正了其他因素以后的结果

Ⅰ型平方和:与自变量进入模型的顺序有关(软件中指定的自变量顺序),自变量的分析结果仅矫正了在它之前的变量

3.交叉设计的方差分析

交叉设计在医学研究中,很常见,是一种相对节省样本的方法。基于“最好的配对就是自身”这一理念,交叉设计采用自身配对的思想,它可以很好地解决各组间在很多方面的差异仍可能会影响到实验结果这一问题

以2×2交叉设计为例,其基本设计过程为:首先将研究对象随机分为两组,第一组先接受A处理,经过一段洗脱期(washout period),消除A处理的响后,再接受B处理及第一组的实验顺序为AB;第二组先接受B处理,经过一段洗脱期(washout period),消除B处理的响后,再接受S处理及第一组的实验顺序为BA。两种处理在实验过程中交叉进行,所以称为交叉设计
dSyWtS.png

交叉设计同时包含了自身对照和组间对照的设计思路,能用较小的样本获得较高的研究效率,尤其适用于医学研究中某些难以获得病例的情况。而且该设计中每一受试对象均按随机原则和一定的实验顺序接受实验处理和对照处理,遵循了伦理原则,并保证了公平性。

注意设计过程中一定要有洗脱期,即在实施两个处理的中间环节设置一段时间的观察期,期间受试对象不接受任何处理,以保证迁移处理的残余效应(carryout effect)已经消失

上述交叉设计的总变异分解为组别因素(两组差异)、时间因素(前后差异)、处理顺序因素(是先接受A还是先接受B) 、个体间差异4个因素,这4个因素的变异(离均差平方和)之和构成了“模型"的变异(2754.2) 。而随机误差变异(441.7) 和模型变异合起来就是总变异(3195.8)

dSyzc9.png

4.总结

总之,不管何种设计类型的方差分析,其思路都是对变异进行分解。设计中考虑到的每个因素都会解释一部分变异。但不同设计考虑的因素各不相同,单因素设计只考虑一个因素;多因素设计考虑多个因素,有时还需要考虑因素之间的交互效应;交叉设计不仅需要考虑处理因素,还有顺序、时间、个体间等多个因素

R代码

 rm(list = ls())
 ##加载survival包中的colon数据集
 library(survival)
 head(colon)
 aa <- colon
 ##执行方差分析,输出Ⅰ型平方和
 t1 <- aov(time~age*differ,data = aa)
 ##展示方差分析结果
 summary(t1)
 ##输出Ⅲ型平方和结果得使用car包
 library(car)
 ##注意先将组别变量改为分类型
 t3 <- Anova(t1,type=3)
 summary(t3)

学完之后才更加深刻地理解了作者的意思,真的是铁打的方差分析,流水的实验设计呀!

参考内容
白话统计学——冯国双

你可能感兴趣的:(方差分析与实验设计)