混合设计方差分析 (Mixed-design ANOVA)

R语言学习资料搜集:原文链接

最近被各种ANOVA搞得头晕,在这里稍微总结一下。

  1. Mixed-degin ANOVA是什么?什么情况使用它?
    要了解Mixed-degin ANOVA,就要先了解普通的方差分析(ANOVA)和重复测定方差分析(Repeated measures ANOVA)。普通的ANOVA和Repeated measures ANOVA的区别在于,前者要求样本是相互独立的,后者则要样本彼此是不独立的。Mixed-degin ANOVA,顾名思义是两种ANOVA的结合,其中即有独立样本,又有不独立的样本。

什么是独立样本和非独立样本呢?样本的独立性体现在实验设计中,取决于你获取因变量(Dependent variance,DV,就是实验数据)的方法。普通的ANOVA实验设计中,每一个样本只处于一种条件下,且只会被测定一次。换句话说就是,实验中不同处理下以及同一处理下的所有重复都必须是相互独立的个体。因此,当测定不同处理下的DV时,需要测定不同的样本;当需要重复测量某一处理下的DV的时候,也需要测定不同的样本(重复样)。例如,一个实验设计是2处理、3水平、3重复的,那么一共就需要233=18个样本,会得到18个DV。反之,如果将同一个体放在不同的实验条件下进行反复测定,那么就是非独立样本。例如,观测一组病人(30人)服降压药之后3个不同时间段血压的变化,那么一共只需要30个样本,但是会得到3*30=90个DV。简而言之,普通的ANOVA中测的永远是组间(between-subject)DV;Repeatedmeasures ANOVA中测的则是组内(within-subject)DV。

了解了独立样本和非独立样本之后,就可以看下什么情况下用哪种ANOVA了。假设实验设计了两个因素(自变量; Independent variance, IV):
1) 当IVs均为Between-subject factors时,用Two-way ANOVA
2) 当IVs均为Within-subject factors时,用Two-way repeated-measures ANOVA
3) 当一个IV是Between-subject factor,一个IV是Within-subject factor时,用Two-factor ,mxed-design ANOVA

  1. Mixed-design ANOVA的实验设计案例 (Two-factor)
    2个IVs:
    1)Within-subject factor = Time (4);
    2)Between-subject factor = Treatments (group 1 & 2)

方差分析Analysis of variance,简称ANOVA)为数据分析中常见的统计模型,主要为探讨连续型(Continuous)资料型态之因变量(Dependent variable)与类别型资料型态之自变量(Independent variable)的关系,当自变项的因子中包含等于或超过三个类别情况下,检定其各类别间平均数是否相等的统计模式,广义上可将T检定中方差相等(Equality of variance)的合并T检定(Pooled T-test)视为是方差分析的一种,基于T检定为分析两组平均数是否相等,并且采用相同的计算概念,而实际上当方差分析套用在合并T检定的分析上时,产生的F值则会等于T检定的平方项。
方差分析依靠F-分布为概率分布的依据,利用平方和(Sum of square)与自由度(Degree of freedom)所计算的组间与组内均方(Mean of square)估计出F值,若有显著差异则考量进行事后比较或称多重比较(Multiple comparison),较常见的为Scheffé's method、Tukey-Kramer method与Bonferroni correction,用于探讨其各组之间的差异为何。
在方差分析的基本运算概念下,依照所感兴趣的因子数量而可分为单因子方差分析、双因子方差分析、多因子方差分析三大类,依照因子的特性不同而有三种型态,固定效应方差分析(fixed-effect analysis of variance)、随机效应方差分析(random-effect analysis of variance)与混合效应方差分析(Mixed-effect analaysis of variance),然而第三种型态在后期发展上被认为是Mixed model的分支,关于更进一步的探讨可参考Mixed model的部分。
方差分析优于两组比较的T检定之处,在于后者会导致多重比较(multiple comparisons)的问题而致使第一型错误(Type one error)的机会增高,因此比较多组平均数是否有差异则是方差分析的主要命题。
在统计学中,方差分析ANOVA)是一系列统计模型及其相关的过程总称,其中某一变量的方差可以分解为归属于不同变量来源的部分。其中最简单的方式中,方差分析的统计测试能够说明几组数据的平均值是否相等,因此得到两组的T检定。在做多组双变量T检定的时候,错误的概率会越来越大,特别是第一型错误,因此方差分析只在二到四组平均值的时候比较有效。

背景和名称
方差分析(ANOVA)是一种特殊形式的统计假设检定,广泛应用于实验数据的分析中。统计假设检定是一种根据数据进行决策的方法。测试结果(通过零假设进行计算)如果不仅仅是因为运气,则在统计学上称为显著。统计显著的结果(当可能性的p值小于临界的“显著值”)则可以推翻零假设。
在方差分析的经典应用中,原假设是假设所有数据组都是整体测试对象的完全随机抽样。这说明所有方法都有相同效果(或无效果)。推翻原假设说明不同的方法,会得到不同的效果。在操作中,假设测试限定I类型错误(假阳性导致的假科学论断)达到某一具体的值。实验者也希望II型错误(假阴性导致的缺乏科学发现)有限。II型错误受到多重因素作用,例如取样范围(很可能与试验成本有关),相关度(当实验标准高的时候,忽视发现的可能性也大)和效果范围(当对一般观察者来说效果明显,II型错误发生率就低)。

ANOVA的模式型态
固定效应模式(Fixed-effects models)
用于方差分析模型中所考虑的因子为固定的情况,换言之,其所感兴趣的因子是来自于特定的范围,例如要比较五种不同的汽车销售量的差异,感兴趣的因子为五种不同的汽车,反应变数为销售量,该命题即限定了特定范围,因此模型的推论结果也将全部着眼在五种汽车的销售差异上,故此种状况下的因子便称为固定效应。

随机效应模式(Random-effects models)
不同于固定效应模式中的因子特定性,在随机效应中所考量的因子是来自于所有可能的母群体中的一组样本,因子方差分析所推论的并非着眼在所选定的因子上,而是推论到因子背后的母群体,例如,借由一间拥有全部车厂种类的二手车公司,从所有车厂中随机挑选5种车厂品牌,用于比较其销售量的差异,最后推论到这间二手公司的销售状况。因此在随机效应模型下,研究者所关心的并非局限在所选定的因子上,而是希望借由这些因子推论背后的母群体特征。

混合效应模式(Mixed-effects models)
此种混合效应绝对不会出现在单因子方差分析中,当双因子或多因子方差分析同时存在固定效应与随机效应时,此种模型便是典型的混合型模式。

你可能感兴趣的:(混合设计方差分析 (Mixed-design ANOVA))