多元线性回归算法(SPSS)

接上篇 (1条消息) 多元线性回归算法(matlab)_成、谋的博客-CSDN博客
本篇博客主要参考自文章: (1条消息) 数学建模暑期集训6:用SPSS对数据进行多元线性回归分析_zstar-_的博客-CSDN博客_多元线性回归分析spss

1.数据

三个变量:树干直径、树干高度、树干体积, 树干体积和树干直径、高度有关
多元线性回归算法(SPSS)_第1张图片

2.画散点图

多元线性回归分析之前,先看看数据是否能近似成线性的。
多元线性回归算法(SPSS)_第2张图片
图中可以看到,体积和直径线性关系很明显,和高度也有一定关系,因此继续进行线性回归分析

3.回归参数设置

分析->回归->线性 进入设置
多元线性回归算法(SPSS)_第3张图片
说明一下:(独立性检验DW)
DW=2,表示无自相关,
DW=4,表示完全负自相关,
DW=0,表示完全正自相关,
DW在0-2之间说明存在正自相关,
DW在2-4之间说明存在负的自相关。
一般情况下,DW值在1.5-2.5之间即可说明无自相关现象
多元线性回归算法(SPSS)_第4张图片

4.查看统计量

模型汇总表:

多元线性回归算法(SPSS)_第5张图片
德宾-沃森指数表示因变量之间的独立性,越接近2越好;

正态性检验

多元线性回归算法(SPSS)_第6张图片
上面的正态性检验,因为回归的条件之一就是满足正态分布,显然,如果是对称的条形图就比较完美了,当然适当的瑕疵也是可以容忍的。
看下面的pp图,点越是集中在线上,越是符合回归的要求。

回归方程的显著性检验

多元线性回归算法(SPSS)_第7张图片

回归系数的显著性检验

多元线性回归算法(SPSS)_第8张图片
可得到线性回归方程为Y = -89.816+5.717X1+0.535X2
Sig<0.05说明两个自变量对树干体积都有显著性检验
方差膨胀因子(VIF)<10,表明数据不存在共线性问题
方差膨胀因子(Variance Inflation Factor,VIF):
VIF越大,表示共线性越严重。
VIF一般不应该大于5,当VIF>10时,提示有严重的多重共线性存在
两个因变量共线性存在,即一个量几乎可由另一个量来近似表示,相当于两个变量只起到了一个变量的效果。

5.逐步法

如果因变量y和自变量x线性效果不好,可以用逐步法来判断那几个x与y的线性特性显著。
在spss的参数设置页面,可以选择“前进”或“后退”,前进即从少到多,后退即从多到少。
多元线性回归算法(SPSS)_第9张图片

你可能感兴趣的:(数学建模,算法,matlab,矩阵)