数据分析之单因素方差分析

一个复杂的事物,其中往往有许多因素互相制约又互相依存。在众多因素和繁多的数据中,想要更加直观方便地了解各种因素对某变量的影响,方差分析是一个不错的选择。

什么是方差分析?

方差分析(Analysis of Variance,简称ANOVA),又称"变异数分析"或"F检验",是R.A.Fisher发明的,用于两个及两个以上样本均数差别的显著性检验。由于各种因素的影响,研究所得的数据呈现波动状。造成波动的原因可分成两类,一是不可控的随机因素,另一是研究中施加的对结果形成影响的可控因素。

方差分析有什么用?

方差分析可以用来判断几组观察到的数据或者处理的结果是否存在显著差异。方差分析是从观测变量的方差入手,研究诸多控制变量中哪些变量是对观测变量有显著影响的变量。

接下来简单介绍一下常用的单因素方差分析

单因素方差分析:是用来研究一个控制变量的不同水平是否对观测变量产生了显著影响,仅研究单个因素对观测变量的影响。

例如,分析不同施肥量是否给农作物产量带来显著影响,考察地区差异是否影响妇女的生育率,研究学历对工资收入的影响等。

操作步骤:(如图)


注:

(1)LSD方法:LSD方法称为最小显著性差异(Least Significant Difference)法。最小显著性差异法的字画就体现了其检验敏感性高的特点,即水平间的均值只要存在一定程度的微小差异就可能被检验出来。正是如此,它利用全部观测变量值,而非仅使用某两组的数据。LSD方法适用于各总体方差相等的情况,但它并没有对犯一类错误的概率问题加以有效控制。

(2)S-N-K方法:S-N-K方法是一种有效划分相似性子集的方法。该方法适合于各水平观测值个数相等的情况。

结果解读:

(图片来源于网络)

1、各组数据的统计描述,包括均值、标准差。

2、F值,P值:

方差分析也叫F检验,这个F就是计算出来的F值,用来评估组间差异。F值表示整个拟合方程的显著,F越大,表示方程越显著,拟合程度也就越好

P值是衡量控制组与实验组差异大小的指标,P值小于0.05,表示两组存在显著差异,P值小于0.01,表示两组的差异极其显著。

END

文 | FM

你可能感兴趣的:(数据分析之单因素方差分析)