回归分析的基本步骤

回归分析是确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法。

  • 拟合优度检验
    • 1 一元回归方程
    • 2 多元回归方程
  • 回归方程的显著性检验
  • 回归系数的显著性检验
  • 残差分析
  • 异常值检验
  • 多重共线性检验

通过样本数据建立的回归方程一般不能直接立即用于对实际问题的分析和预测,需要进行各种统计检验,主要包括回归方程的拟合优度检验、回归方程显著性检验、回归系数显著性检验、残差分析、异常值检验和多重共线性检验等。接下来详细的介绍回归分析的各种统计检验:

1. 拟合优度检验

回归方程的拟合优度检验是为了检验样本数据点在回归线周围的密集程度,从而用来评估回归方程对样本数据的代表程度。拟合优度是用于评价自变量对因变量的解释程度,拟合优度越高(越接近于1),表示自变量对因变量的解释越强,反之越弱。
回归方程预测值和实际观察值的差异主要由解释变量x取值不同造成以及其他随机因素两方面造成。

回归平方和(SSA):

SSA=i=1n(y^iy¯)2

残差平方和(也称为剩余平方和,SSE):
SSA=i=1n(yiy¯)2

总离差平方和(SST): ,且 SST=SSA+SSE

1.1 一元回归方程

对于一元回归的拟合优度 检验采用 R2 ,反映回归方程所能解释的变差比例,也称为判定系数或决定系数, 1R2 则体现了被解释变量总变差中回归方程无法解释的比例。 R2 的取值在0~1之间, R2 越接近于1,说明回归方程对样本数据的拟合优度越高;反之,越接近0,回归方程拟合优度越低。

R2=ni=1(y^iy¯)2ni=1(yiy¯)2=1ni=1(yiy^i)2ni=1(yiy¯)2

1.2 多元回归方程

多元回归方程的拟合优度采用调整的判定系数或调整的决定系数: R¯2 统计量

R¯2=1SEEnp1SSTn1

其中n-p-1,n-1分别为SSE和SST的自由度。

2. 回归方程的显著性检验

多元回归方程

3. 回归系数的显著性检验

多元回归方程

4. 残差分析

多元回归方程

5. 异常值检验

多元回归方程

6. 多重共线性检验

多元回归方程

你可能感兴趣的:(回归分析)