ANOVA简介

单因素anova

在实际运用中经常还要对具有相同方差的多个正态总体均值进行比较的假设检验问题,所以引入了方差分析



如图所示,考虑某因素的影响是否对各水平之间产生显著影响

通常将要考察的对象的某种特征称为指标,影响指标的各种因素称为因子,因子控制在几个不同的状态上,每一个状态称为因子的一个水平

若一项实验仅有一个因子在改变,为单因素实验;多于一个因子改变的实验为多因素实验

我们来看一个示例



该例子中,指标为电池的寿命;因子为生产电池的工厂;水平为工厂A1,A2,A3
在此例子中只有生产电池的工厂这一因子改变,故为单因素实验
目的是考察不同厂家生产的电池平均寿命是否有显著差异。如果有显著差异,表明生产工厂这一因子对电池寿命的影响是显著的

三大假设

对于单因素anova,有是哪个基本假设:
1.每个部分总体服从正态分布



2.部分总体的方差都相等(方差齐次)



3.不同的部分总体下的样本是相互独立的,其中

都是未知参数

数学模型

在水平Aj下进行nj次独立实验



记:



称为随机误差
因此单因素anova的数学模型

统计量的引入

我们引入一些统计量,以便做假设检验



单因素试验数据表如下


假设检验

接下来我们要针对数据做一下假设检验
我们先看一下原假设和备择假设



而单因素anova的基本原理是将样本的全部偏差的平方和分解成两个平方和,即组间平方和和组内平方和,通过这两个平方和之间的比较,来做假设检验




那么,SA和SE有什么特征呢?

那么我们就可以构造统计量来进行假设检验了



然后建立单因素方差分析表

这样就可以检验了

双因素anova

我们假设一个例子

检验a,b两种抗癌药物的效果,要做动物实验,做法是:将患有某癌症的白鼠随机分为三组:
第一组:注射a物质
第二组:注射b物质
第三组:不处理
观察一定时间,得到寿命数据
考虑到白鼠性别可能影响白鼠寿命,将性别作为因一个因素,因此有两个因素
因素A:药物,三个水平
因素B:性别,两个水平
共6种组合

无交互作用双因素方差分析

那么这种情况的数学模型是什么呢?



其中μij是每一种组合的均值,因为是每种组合只做一次试验,那么仅有一个观测值,那么μij即为该观测值
其中可以改写为

进一步改写为

我们先看看这种情况的原假设和备择假设

我们做如下规定:


平方和分解为:

那么当H01成立时

那么当H02成立时

方差分析表如下:


有交互作用的


从图表中我们可以知道,比方说A1,B1的交界,做了t次试验,那么就会有t个观测值,其他也一样
故基本的数学模型为



因为每种组合有多次试验,因此就有多个观测值,此时的μij表示的是每种组合观测值的均值
那么模型可改写为



进一步改写为:

那么交互项为:


那么这种情况的原假设和备择假设为



记:

那么我们一样的对平方和有所定义:

所以平方和分解为:

我们构造统计量进行假设检验

总结方差分析表为:

参考:https://www.bilibili.com/video/BV1TE411K7G2

你可能感兴趣的:(ANOVA简介)