读「统计学七支柱」——Design和Residual

Design

Design, 即设计,指的是通过巧妙地构造模型,高效的完成统计分析任务。

一般我们需要考察某个因素的作用,会采用控制变量法,又称为单一变量法。这种方法需要保证每两次对比实验,
需要保证只有一个因素不同,这样就能保证结果是由这个因素导致的。在这个基础上,作者介绍了费舍尔的多因子设计。概括
来说,就是在试验中同时处理多个因素的变化,并给出如下关系:

x为各观测数据的均值,等变量分别表示不同因素的影响,表示未知其他因素。通过这种实验方法,可以
同时研究多个因素对目标变量的影响。

Residual

Residual,即残差,指的是试验数据中,真实值与观测值之间的差,一般用来考察模型合理性及数据的可靠性。

可以从两个方面来看残差:

  • 观测过程带来的误差,例如不同人员的观测习惯,观测仪器的精度等等
  • 存在未知的因素

简单来说,如果残差过大,那么现有的模型可能精度不够,存在较大的误差,那么模型的可信度就要打折扣了。

你可能感兴趣的:(读「统计学七支柱」——Design和Residual)