数学建模之方差分析

数学建模之方差分析

  • 方差分析(Analysis of Variance, ANOVA)
    • 应用场景
    • 单因素方差分析
      • Matlab实现——anova1
        • 多重比较
    • 双因素方差分析
      • Matlab实现——anova2
    • 多因素方差分析
  • 参考文献

方差分析(Analysis of Variance, ANOVA)

——用数理统计分析试验结果,鉴别各因素对结果影响程度的方法。

人们关心的试验结果称为指标,试验中需要考察、可以控制的条件称为因素或因子,因素所处的状态称为水平

应用场景

为了使生产过程稳定,达到优质、高产,需要对影响产品质量的因素进行分析,找出有显著影响的那些因素,除了从机理方面进行研究外,常常要做许多试验,对结果作分析、比较,寻求规律。

例如,从用几种不同工艺制成的灯泡中,各抽取了若干测量其寿命,要推断这几种工艺制成的灯泡寿命是否有显著差异;(判断不同工艺对灯泡寿命的影响程度)[单因素方差分析]

再如,用几种化肥和几个小麦品种在若干试验田里种植小麦,要推断不同的化肥和品种对产量有无显著差异[双因素方差分析]

单因素方差分析

只考虑一个因素A,A取几个水平,在每个水平上做若干试验,试验过程中,除A外的其他影响指标的因素都保持不变(只有随机因素存在)

将问题转换为假设检验——利用F-分布做显著性水平检验。

方差分析一般用的显著性水平是:

  • α = 0.01 \alpha = 0.01 α=0.01,拒绝 H 0 H_0 H0,称因素A的影响(或A各水平的差异)非常显著
  • α = 0.01 \alpha = 0.01 α=0.01,不拒绝 H 0 H_0 H0;而取 α = 0.05 \alpha = 0.05 α=0.05,拒绝 H 0 H_0 H0,称因素A的影响显著
  • α = 0.05 \alpha = 0.05 α=0.05,不拒绝 H 0 H_0 H0,称因素A的无显著影响

数学建模之方差分析_第1张图片

Matlab实现——anova1

处理均衡数据(各组数据个数相等)的用法为:p=anova1(x)(注意是1而不是l)

这里返回值 p p p是一个概率,当 p > α p>\alpha p>α时,接受 H 0 H_0 H0 x x x m × r m \times r m×r x x x的每一列是一个水平的数据(这里各个水平上的样本容量 n i = m n_i = m ni=m)。另外,还输出一个方差表和一个Box图

示例:
数学建模之方差分析_第2张图片
代码运行结果:
数学建模之方差分析_第3张图片
数学建模之方差分析_第4张图片
处理非均衡数据(各组数据个数不等)的用法为:p=anova1(x,group)

x x x为向量,从第1组到第 r r r组数据依次排列: g r o u p group group为与 x x x同长度的向量,标志 x x x中数据的组别(在于 x x x i i i组数据相对应的位置出输入整数 i ( i = 1 , 2 , . . . , 4 ) i(i=1,2,...,4) i(i=1,2,...,4)

示例:
数学建模之方差分析_第5张图片
代码运行结果:
数学建模之方差分析_第6张图片
数学建模之方差分析_第7张图片
数学建模之方差分析_第8张图片
数学建模之方差分析_第9张图片

多重比较

数学建模之方差分析_第10张图片
代码运行结果:
数学建模之方差分析_第11张图片
数学建模之方差分析_第12张图片
数学建模之方差分析_第13张图片

双因素方差分析

——考虑两个因素A,B对指标的影响。A,B各划分几个水平,对每一个水平组合做若干次试验,对所得数据进行方差分析,检验两因素是否对分别对指标有显著影响,或者还要进一步检验两因素是否对指标有显著的交互影响
数学建模之方差分析_第14张图片
数学建模之方差分析_第15张图片
数学建模之方差分析_第16张图片
数学建模之方差分析_第17张图片

Matlab实现——anova2

p=anova2(x,reps)
其中, x x x不同列的数据表示单一因素的变化情况,不同行中的数据表示另一因素的变化情况。如果每一“单元”有不止一个观测值,则用参数reps来表明每个“单元”多个观测值的不同标号,即reps给出重复试验的次数 t t t

例如,下面的矩阵中,列因素有3个水平,行因素有2个水平,但每组水平有两组样本,相应地用下标来标识。
数学建模之方差分析_第18张图片
数学建模之方差分析_第19张图片
数学建模之方差分析_第20张图片

多因素方差分析

前面介绍了一个或两个因素的试验,由于因素较少,我们可以对不同因素的所有可能的水平组合做试验——全面试验

当因素较多时,实际难以实现全面试验,故而需考虑合理的试验方案,使得试验次数不多,但也能得到比较满意的结果。
——一种可行的方案:正交试验设计。

正交表:一系列规格化的表格,每一个表都有一个记号,如 L 9 ( 3 4 ) L_9(3^4) L9(34)

最简单的正交表是 L 4 ( 2 3 ) L_4(2^3) L4(23),其含意为:“L”代表正交表;L下角的数字“4”表示有 4 横行,简称行,即要做四次试验;括号内的指数“3”表示有3 纵列,简称列,即最多允许安排的因素是3 个;括号内的数“2”表示表的主要部分只有2 种数字,即因素有两种水平1与2。

正交表的特点是其安排的试验方法具有均衡搭配特性:

  1. 每列中数字出现的次数相同,如 L 9 ( 3 4 ) L_9(3^4) L9(34)表每列中数字1,2,3均出现三次
  2. 任取两列数字的搭配都是均衡的,如 L 9 ( 3 4 ) L_9(3^4) L9(34)表里每两列中 ( 1 , 1 ) (1,1) (1,1) ( 2 , 2 ) (2,2) (2,2),…, ( 3 , 3 ) (3,3) (3,3)九种组合各出现一次

这种均衡性使得根据正交表安排的试验,其试验结果具有很好的可比性,易于进行统计分析。

用正交表安排试验时,根据因素和水平个数的多少以及试验工作量的大小来考虑选用哪张正交表。例如:
数学建模之方差分析_第21张图片
数学建模之方差分析_第22张图片

参考文献

[1] 司守奎.数学建模算法与程序[M].海军航空工程学院, 2007

你可能感兴趣的:(数学建模,数学建模,统计分析)