检验两个以上总体的均值彼此是否相等,数理统计分析试验结果、鉴别各因素对结果影响程度的方法称为方差分析(Analysis Of Variance),记作 ANOVA。人们关心的试验结果称为指标,试验中需要考察、可以控制的条件称为因素或因子,因素所处的状态称为水平。
方差分析一般用的显著性水平是:取α = 0.01,拒绝 H0 ,称因素 A 的影响(或 A各水平的差异)非常显著;取α = 0.01,不拒绝 H0 ,但取α = 0.05 ,拒绝 H0 ,称因素 A 的影响显著;取α = 0.05 ,不拒绝 H0 ,称因素 A 无显著影响。
Matlab 统计工具箱中单因素方差分析的命令是 anoval。
若各组数据个数相等,称为均衡数据。若各组数据个数不等,称非均衡数据。
(1)均衡数据
处理均衡数据的用法为:
p=anoval(x)
返回值 p 是一个概率,当 p > α 时接受 H0 ,x 为m× r 的数据矩阵,x 的每一列是一个水平的数据(这里各个水平上的样本容量 ni = m )。另外,还输出一个方差表和一个Box 图。
(2)非均衡数据
处理非均衡数据的用法为:
p=anova1(x,group)
x 为向量,从第 1 组到第 r 组数据依次排列;group 为与 x 同长度的向量,标志 x 中数据的组别(在与 x 第i 组数据相对应的位置处输入整数i
如果根据经验或某种分析能够事先判定两因素之间没有交互影响,每组试验就不必重复,即可令t = 1,过程大为简化。
统计工具箱中用 anova2 作双因素方差分析。命令为
p=anova2(x,reps)
其中 x 不同列的数据表示单一因素的变化情况,不同行中的数据表示另一因素的变化情况。如果每种行—列对(“单元”)有不止一个的观测值,则用参数 reps 来表明每个“单元”多个观测值的不同标号,即 reps 给出重复试验的次数t 。下面的矩阵中,列因素有 3 种水平,行因素有两种水平,但每组水平有两组样本,相应地用下标来标识:
前面介绍了一个或两个因素的试验,由于因素较少,我们可以对不同因素的所有可能的水平组合做试验,这叫做全面试验。当因素较多时,虽然理论上仍可采用前面的方
法进行全面试验后再做相应的方差分析,但是在实际中有时会遇到试验次数太多的问
题。如三因素四水平的问题,所有不同水平的组合有 3 4 =64 种,在每一种组合下只进行一次试验,也需做 64 次。如果考虑更多的因素及水平,则全面试验的次数可能会大得惊人。因此在实际应用中,对于多因素做全面试验是不现实的。于是我们考虑是否可以选择其中一部分组合进行试验,这就要用到试验设计方法选择合理的试验方案,使得试验次数不多,但也能得到比较满意的结果。