《R语言实战》自学笔记56-方差分析术语

第9章 方差分析

9.1 术语速成

为便于理解方差分析的相关名词,我构建一个案例:假如我们研究氮肥用量和玉米品种对玉米产量影响。设置一个田间试验,试验包括氮肥用量两个N1(200 kg/ha)和N2(300 kg/ha),玉米品种两个先玉335(XY335)和郑单958(ZD958),3次重复,测定指标为玉米产量。

1、田间试验相关概念

试验处理(experimental treatments):事先设计好的实施在试验单位上的具体项目称为试验处理,简称处理。
在单因素试验中,实施在试验单位上的具体项目就是试验因素的某一水平。假设我们的试验是两个氮水平对某一玉米品种产量的影响,那么试验处理就是N1和N2,所以进行单因素试验时,试验因素的一个水平就是一个处理。
在多因素试验中,实施在试验单位上的具体项目是各因素的某一水平组合。例如本例中的品种郑单958下N1或者品种郑单958下N2;所以,在多因素试验时,试验因素的一个水平组合就是一个处理。

试验指标(experimental index):为衡量试验结果的好坏或处理效应的高低,在试验中具体测定的性状或观测的项目称为试验指标。由于试验项目的不同,选择的试验指标也不相同。农业试验中许多数量性状和质量性状都可以作为试验指标,例如本例中的试验指标为玉米产量。

试验因素(experimental factor):试验中人为控制的、影响试验指标的原因称为试验因素。当试验中考察的因素只有一个时,称为单因素试验;假如我们的例子中只用一个玉米品种,那么就是单因素试验,因素为氮肥;若同时研究两个或两个以上的因素对试验指标的影响时,则称为两因素或多因素试验。例如本例中的氮肥用量和玉米品种,为两因素试验,加入此试验再增设了覆地膜和不覆膜两种栽培措施,那么就是三因素试验,依此类推,再增加就是多因素试验。

因素水平(factor level):对试验因素所设定的量的不同级别或质的不同状态称为因素的水平,简称水平。例如本例中的N1和N2就是因素氮肥的两个水平,或者郑单958和先玉335就是玉米品种的两个水平。

重复(repetition):试验中将一个处理实施在两个或两个以上的试验单位上,称为重复,一处理实施的试验单位数称为处理的重复数。如本例中的重复3次。

试验小区(experimental plot):安排一个试验处理的小块地段称为试验小区,简称小区。

试验单位(experimental unit):亦称试验单元,指施加试验处理的材料单位,例如可以是一个小区,一株玉米等,如本例中郑单958下N1。

试验误差(experimental error):受非处理因素的影响使观测值与试验处理真值之间产生的差异。试验误差可分为系统误差和随机误差。
系统误差(systematic error):试验过程中产生的误差,系统误差影响试验的准确性。如本例中玉米种植地块肥力的差异;
随机误差(random error):由多种偶然的、无法控制的因素引起的误差;随机误差影响试验的精确性。如本例产量测定时,测定的方法不同,结果不同。

2、统计相关概念

自变量(independent variable):自变量是指研究者主动操纵,而引起因变量发生变化的因素或条件。自变量被看作是因变量的原因。如本例中氮肥或者品种是自变量。

因变量(dependent variable):在试验中,由于试验变量而引起试验对象的变化和结果叫做因变量。本例中玉米产量是因变量。

因子设计(factorial design):几个自变量分别由几个水平构成的多因素的实验设计称为因子设计(或因素设计)。当一个变量的每一个水平都包含另一个变量的所有水平时,即是一个因子设计。

组间因子:本例中氮肥用量即为组间因子,影响产量的来源于一个组别,即氮肥;

均衡设计(balance design)和非均衡设计(inbalance design):如果在一个实验设计中任一因素各水平在所有单元格中出现的次数相同,且每个单元格内的元素数均相同,则该试验是均衡的,否则,就被称为不均衡。如本例中产量观测在各处理下均为3次,观测数相等,所以为均衡设计;假如先玉335下两个氮水平下的产量均测定了5次,那么就是非均衡设计了;

主效应(main effect):各试验因素的相对独立作用。在多因素实验研究中,主效应就是在考察一个变量是否会对因变量的变化发生影响的时候,不考虑其他研究变量的变化,或者说将其他变量的变化效应平均掉。也就是其他研究变量都不变化的情况下,单独考察一个自变量对因变量的变化效应。如本例中氮肥或品种为主效应。

交互效应(interaction effect):在多因素试验中,一个因素对试验结果的影响依赖于另一个因素所取的水平,称两因素有交互作用,如本例中氮肥和品种为交互效应。

多重比较(multiple comparisons):要明确不同处理平均数两两间差异的显著性,每个处理的平均数都要与其他处理进行比较,这种差异显著性检验就叫多重比较。

协变量(Covariates):指对因变量可能有影响,需要在分析时对其作用加以控制的连续性变量,实际上,可以简单的把因素和协变量分别理解为分类自变量和连续性自变量,当模型中存在协变量时,一般是通过找出它与因变量的回归关系来控制其影响。

3、方差分析的概念和原理

方差分析(analysis of variance):又称“变异数分析”或“F检验”,是由罗纳德·费雪爵士发明的,用于两个及两个以上样本均数差别的显著性检验。
方差分析的基本原理
方差分析认为不同处理组的均数间的差别基本来源有两个:
(1) 实验条件,即不同的处理造成的差异,称为组间差异。用变量在各组的均值与总均值之偏差平方和的总和表示,记作,组间自由度。
(2) 随机误差,如测量误差造成的差异或个体间的差异,称为组内差异,用变量在各组的均值与该组内变量值之偏差平方和的总和表示,记作,组内自由度。

是总偏差平方和,组内、组间除以各自的自由度(组内,组间,其中为样本总数,为组数),得到其均方和,一种情况是处理没有作用,即各组样本均来自同一总体,。另一种情况是处理确实有作用,组间均方是由于误差与不同处理共同导致的结果,即各样本来自不同总体。那么,(远远大于)。
比值构成分布。用值与其临界值比较,推断各样本是否来自相同的总体。

4、方差分析的类型

单因素方差分析(One-way ANOVA):研究一个控制变量的不同水平是否对观测变量产生了显著影响。

多因素方差分析:多因子方差分析为考虑了多分类自变量影响的方差分析,这种分析会涉及到多因子交互的问题。

协方差分析(analysis of covariance,ANCOVA):协方差分析将那些人为很难控制的控制因素作为协变量,并在排除协变量对观测变量影响的条件下,分析控制变量(可控)对观测变量的作用,从而更加准确地对控制因素进行评价。

多元方差分析(multivariate analysis of variance,MANOVA):在统计学中,多元方差分析(MANOVA)是一种比较多变量样本均值的程序。作为一个多变量过程,它在有两个或多个因变量时使用,并且通常后面是分别涉及各个因变量的显着性检验。

多元协方差分析(multivariate analysis of covariance,MANCOVA):当因变量不止一个时,设计被称作多元方差分析( MANOV A),若协变量也存在,那么就叫多元协方差分析(MANCOV A)。

参考资料:

  1. 《R语言实战》(中文版),人民邮电出版社,2013.
  2. 方差分析-百度,https://baike.baidu.com/item/%E6%96%B9%E5%B7%AE%E5%88%86%E6%9E%90/1502206
  3. 方差分析的基本概念,https://blog.csdn.net/szmt910912/article/details/46475801
  4. 《田间试验与统计分析》,明道绪,科学出版社,2008

你可能感兴趣的:(《R语言实战》自学笔记56-方差分析术语)