统计学习:方差分析(ANOVA2)

统计学习

最近在做信号处理的时候发现自己的理论知识不够,因此,开始了理论的重学之路,特开此系列帖子,总结自己的学习收获以及方便后来的小伙伴。


方差分析ANOVA

方差的分析,通常被叫做ANOVA,可以被应用于随机变量来自于多于两类样本的情景。
.
当我们只有两个样本来源的时候,我们可以使用T-test 来检验关于样本均值的假设,但当样本数量大于两个的时候,这就变得不可实现了。如果我们只是比较两个均值,那么t-test(独立样本)会给出和ANOVA相同的结果
它被用来比较多于两个样本的均值。可以通过一个例子加深大家对它的理解。


单因素方差分析

例子:
假设我们要测试五种不同练习的效果。为了这个目的,我们招募了20个男人并且将他们分为5组,每组4个人,且每组分配的运动不同,在训练几周后,我们记录了他们的体重。

上述是一个单因素均衡ANOVA的例子。

因为这里只有一个变量的效果被检验,因此被命名为单因素。同时每个小组都拥有相同数量的实验个体,因此被叫做均衡。
最后,该检验的出发点是检验被试个体是相似还是不相似?


为什么不使用多样本T-test?

正如上文提到的,T-test只能用在两个均值的差异上。当有多于两个的均值被检验是,不可能用很多个T-test来比较各个的均值和其他的均值。

但使用多项T-test会导致许多其他的并发的问题,因此在这种情况下,我们使用ANOVA。因此,任何时候当这里有多个群体的均值假设需要做的时候都可以使用这个技术。


单因素和双因素方差分析

现在,我们可能会提出一些问题:我们讨论的均值是什么,为什么要分析方差,以便得出关于均值的结论。
整个过程可以在实验的帮助下明确。
让我们研究下肥料对小麦产量的影响。我们针对五种品质不同的肥料将其应用到五块小麦地上面。记录每个地块的产量,并观察地块间产量的差异。在这里,肥料是一个因素,肥料的不同品质称为水平。

这是一个单品质或者说单因素方差分析因为这里只有一个因素,肥料的品质。我们可能也有兴趣研究土地的肥力效应。这样的话我们就有两个因素了,肥料和土壤肥力。这是一个双品质或者说双因素方差分析的实例。相似地,加入第三个因子,这就会是一个三方向或者三因素方差分析了。


偶然因素以及确定因素

在之前描述的实验中,从地块获得的产量可能是不同的,我们可能会因此得出这样的结论:由于肥料质量的差异而导致了小麦产量的差异。

但小麦的产量差异也有可能是某些其他因素的结果,这些因素可以归因于偶然,也有可能是超出了人类控制的一些因子。这个因素可以被解释为“误差”。因此,不同地块之间,产量的差异或者不同可能来自于误差。

因此,估计因为可确定的原因(样本间的差异)和偶然的原因(样本间的共性)导致的变化量应该分别得到,并且使用F-test进行比较,并依赖F值给出相应的结论。


假设

在ANOVA分析中,这里有几个基本的假设。

  • 误差的期望值是0
  • 每个误差项的方差都相等
  • 每个误差项都是独立的
  • 他们都是正态分布

典型分析结果汇总表:
统计学习:方差分析(ANOVA2)_第1张图片


参考:

方差分析
方差分析表
探索ANOVA

你可能感兴趣的:(统计学)