R-方差分析详解4

作为方差分析这个系列的收尾,接3双因素方差分析案例,补充完双因素方差分析的原理。


不考虑交互作用的原理

接例3,如不考虑交互作用,则原假设有两个:

H01:因素1 甜/咸对消费者的喜好程度影响不显著

即因素1下,甜/咸两种水平的总体打分均值相等(已知60个样本打分值)

H02:因素2 辣/微辣/不辣对消费者的喜好程度影响不显著

即因素2下,辣/微辣/不辣三种水平的总体打分均值相等(已知60个样本打分值)

大致类似两个单因素方差分析,具体参见R-方差分析详解1这一篇(摘要:样本组间、组内方差、样本个数、单因素水平数这4个变量的上述计算结果服从自由度为(r-1,n-r)的F分布)

不同的是,在单因素下,样本组间方差只有1个,但在双因素下,组间方差就对应有2个,此时:

总离差平方和=SSA1+SSA2+SSE

以例3数据为例:

R-方差分析详解4_第1张图片
方差分析4 by 三只

因素1的样本均值=(甜水平下30个样本打分值的均值63.6+咸水平下30个样本打分值的均值73.6)/ 2=68.6

SSA1=(63.6-68.6)^2*30+(73.6-68.6)^2*30=1500

因素2的样本均值=(不辣水平下20个样本打分值的均值61.45+微辣水平下20个样本打分值的均值75.65+辣水平下20个样本打分值的均值68.7)/ 3=68.6

SSA2=(61.45-68.6)^2*20+(75.65-68.6)^2*20+(68.7-68.6)^2*20=2016.7

SSE=(每个样本值-对应因素1样本均值-对应因素2样本均值+总体均值)^2=(42-63.6-61.5+68.6)^2+(62-63.6-61.5+68.6)^2+…+(83-73.6-68.7+68.6)^2=8973.7

由于因素1有两个水平,因此SSA1对应的自由度为n1=2-1=1

因素2有三个水平,因此SSA2对应的自由度为n2=3-1=2

SSE组内方差(又称误差平方和)对应的自由度为n3=样本量60-2-3+1=56

以上为方差分析结果中df,sum sq的计算原理。

此时验证因素1的假设H01,其原理同单因素方差分析,即F1值=(SSA1=1500/df=1)/(SSE=8974/df=56)=9.361,若原假设成立,则理论应服从自由度为(1,56)的F分布,但此时F1值对应的P1=0.0034,远远小于显著性水平,因此,拒绝原假设,认为因素1下,甜/咸两水平对于消费者的影响程度显著;

同理验证因素2的假设H02,F2=(SSA2=2016.7/df=2)/( SSE=8974/df=56)=6.293,对应P2=0.00343,远远小于显著性水平,因此,拒绝原假设,认为因素2下,辣/微辣/不辣三水平对于消费者的影响程度显著。

此结果可对照R-方差分析详解3这一篇。


考虑交互作用的原理

一般针对于重复实验的会考虑交互作用(重复实验的概念参见R-方差分析详解1),此时原假设再增加一个H03:因素12的交互对消费者的喜好程度影响不显著。

总离差平方和=SSA1+SSA2+SSA12+SSE。

SSA1和SSA2不变,而SSE值的计算方法则会受到新增因素的影响,先计算SSE,不列公式,参考上文图中数据进行推导:

R-方差分析详解4_第2张图片
方差分析4 by 三只

SSE=(每个样本值-对应交互水平下的样本均值)^2=(42-54.9)^2+(62-54.9)^2+…+(83-69)^2=8285.4

SSA12=((6个交互水平下,每个的样本均值-对应因素1样本均值-对应因素2样本均值+总体样本均值)=(54.9-61.5-63.6+68.6)^2+(68-61.5-73.6+68.6)^2+(67.5-75.7-63.6+68.6)^2+(83.8-75.7-73.6+68.6)^2+(68.4-68.7-63.6+68.6)^2+(69-68.7-73.6+68.6)^2)*样本量60 / 交互水平6=688.3

此时因素1、2虽然验证方式不变,但对应的F值会因SSE值的改变而改变,相应P值也会有变化,因此单因素的影响程度可能会在考虑交互作用后有一定的变化;这个也是比较符合实际情况的,即如果有需要考虑交互影响的场景中,未考虑到交互影响,则可能会产生将交互影响的作用误判给某一个或多个因素的影响。

验证交互作用的假设H03,原理也是不变的,F3=(SSA12=688.3/df=df1*df2=2)/(

SSE=8285.4/df=60-2-3+1-2=54)=2.243,对应P2=0.11594,大于显著性水平,因此,接受原假设,认为交互作用对于消费者的影响程度不显著。

以上,方差分析系列已全部捋了一遍,欢迎补充。



 

你可能感兴趣的:(R-方差分析详解4)