学习统计学之方差分析

方差分析是用来研究诸多控制变量中哪些变量对观测变量的变化有显著性性的影响,对观测变量有显著性影响的各个控制变量的不同水平以及各个水平的交互搭配是如何影响观测变量的。方差分析认为观测变量值的变化是有控制变量的不同水平和随机因素影响的,如果控制变量的不同水平对观测变量产生了显著性影响,则他和随机变量共同作用会使得观测值有显著性变动,即如果观测值在某个控制变量的各个水平下出现了明显的波动,则认为该变量可以使观测值发生显著性影响。它的两个基本假设是观测变量各总体应服从正态分布;观测变量各总体的方差相同。方差分析对不同水平的观测所对应的总体分布分布是否存在显著性差异的推断可以转化成对各个总体均值是否存在显著性差异的推断。方差分析基本思想:变异分解,总变异=随机变异+处理因素导致的变异,又可以分解为总变异=组内变异+组间变异,F=组间变异/组内变异,F的值越大,处理因素的影响越大。

单因素方差分析

顾名思义,单因素方差分析用来研究一个控制变量的不同水平是否对观测变量产生了显著性影响。
SST=SSA+SSE
SST:总离差平方和,它是样本中各个观测值与观测变量的均值的离差平方和。
学习统计学之方差分析_第1张图片
k为控制变量的水平数, x i j x_ij xij为控制变量第i个水平下的j个样本值, n i n_i ni为控制变量第i个水平下的样本量;x拔为观测变量均值。
SSA:为组间离差平方和,它是各个水平组均值与总均值离差的平方和,反映了控制变量不同水平对观测变量的影响
学习统计学之方差分析_第2张图片
SSE:它是每个样本数据与各自的水平组均值的离差平方和,反映了由于抽样误差的存在导致各个水平组的波动大小。
学习统计学之方差分析_第3张图片

基本步骤

单因素方差分析的原假设是:控制变量的不同水平下观测变量对各总体的均值无显著差异。
采用的统计量为F=SSA(k-1)/SSE(n-k)=MSA/MSE,MSA是平均组间平方和,也称组间方差;MSE是平均组内平方和,也叫组内方差,其目的是消除水平数和样本量对分析带来的影响。F统计量服从(k-1,n-k)个自由度的F分布。
计算所给样本的统计量和相应的概率P值,如果控制变量的不同水平对观测变量造成了显著性的影响,则F显著大于1,反之F接近1。
总结:单因素方差分析实则解决了多独立样本T检验需要两两比较均值的缺点。它根据分组获得各个水平下的总体均值,将观测总体各个样本的误差分解成组间误差和组内误差,然后构建的F统计量实则是组间方差与组内方差之间的比值,如果比值显著大于1,则可以认为是由于不同的水平使得观测值发生了显著的变化,如果等于1,则可以认为不同的水平并没有对观测值产生影响。

进一步分析

1.在方差分析中,假设前提是控制变量不同水平下观测变量总体方差无显著差异,所以在进行方差分析前,有必要对方差是否齐性进行检验。
2.如果需要确定控制变量的不同水平对观测变量的影响程度如何,则需要使用多重比较的方法。

多因素方差分析

多因素方差用来研究两个或两个以上的控制变量是否对观测变量产生了显著的影响,它不仅能分析多个因素对观测变量的独立影响,更能分析多个控制因素的交互作用能否对观测变量的分布产生显著的影响,相比单因素方差分析,多因素方差分析还考虑了不同控制因素的交互影响,以两个控制变量为例:SST=SSA+SSB+SSE+SSAB。
原假设为各控制变量不同水平下观测变量总体均值无显著差异。
统计量的选择也和单因素方差分析一样,可以通过分解成固定效应和随机效应两种类型,在多因素的情况下,可以分别构建出各个因素的F统计量。

协方差分析

协方差分析是对方差分析的补充,因为在现实生活中,有时会存在一些变量因素对方差分析的结果产生影响,例如在探讨不同品牌的猪饲料对体重是否有显著性的影响,猪的初始体重也会存在影响,可以使用协方差分析法来剔除影响。

你可能感兴趣的:(统计学,方差分析,统计学,协方差)