4.8 (1)计算y,X1,X2,X3的相关系数矩阵
分析>-相关>-双变量>-拖入变量>-其他保持默认
输出结果
相关性 |
|||||
|
货运总量 |
工业总产值 |
农业总产值 |
居民非商品支出 |
|
货运总量 |
皮尔逊相关性 |
1 |
.556 |
.731* |
.724* |
Sig.(双尾) |
|
.095 |
.016 |
.018 |
|
个案数 |
10 |
10 |
10 |
10 |
|
工业总产值 |
皮尔逊相关性 |
.556 |
1 |
.113 |
.398 |
Sig.(双尾) |
.095 |
|
.756 |
.254 |
|
个案数 |
10 |
10 |
10 |
10 |
|
农业总产值 |
皮尔逊相关性 |
.731* |
.113 |
1 |
.547 |
Sig.(双尾) |
.016 |
.756 |
|
.101 |
|
个案数 |
10 |
10 |
10 |
10 |
|
居民非商品支出 |
皮尔逊相关性 |
.724* |
.398 |
.547 |
1 |
Sig.(双尾) |
.018 |
.254 |
.101 |
|
|
个案数 |
10 |
10 |
10 |
10 |
|
*. 在 0.05 级别(双尾),相关性显著。 |
每行皮尔逊相关性组成相关矩阵
(2)求y关于X1,X2,X3的三元线性回归方程
分析>-回归>-线性>-拖入自变量因变量,其他保持默认
输出结果
系数a |
||||||
模型 |
未标准化系数 |
标准化系数 |
t |
显著性 |
||
B |
标准错误 |
Beta |
||||
1 |
(常量) |
-348.280 |
176.459 |
|
-1.974 |
.096 |
工业总产值 |
3.754 |
1.933 |
.385 |
1.942 |
.100 |
|
农业总产值 |
7.101 |
2.880 |
.535 |
2.465 |
.049 |
|
居民非商品支出 |
12.447 |
10.569 |
.277 |
1.178 |
.284 |
|
a. 因变量:货运总量 |
得到系数B列
则三元线性回归方程为
(3)对所求方程做拟合优度检验
上面操作中也出现了
模型摘要 |
||||
模型 |
R |
R 方 |
调整后 R 方 |
标准估算的错误 |
1 |
.898a |
.806 |
.708 |
23.442 |
a. 预测变量:(常量), 居民非商品支出, 工业总产值, 农业总产值 |
调整后的决定系数为0.708,说明回归方程对样本观测值的拟合程度较好
(4)对回归方程做显著性检验
ANOVAa |
||||||
模型 |
平方和 |
自由度 |
均方 |
F |
显著性 |
|
1 |
回归 |
13655.370 |
3 |
4551.790 |
8.283 |
.015b |
残差 |
3297.130 |
6 |
549.522 |
|
|
|
总计 |
16952.500 |
9 |
|
|
|
|
a. 因变量:货运总量 |
||||||
b. 预测变量:(常量), 居民非商品支出, 工业总产值, 农业总产值 |
原假设:
F统计量服从自由度为(3,6)的F分布,给定显著性水平
查表得
由方差分析表得F值=8.2834.76,P值等于0.015<显著性水平,落在拒绝域,拒绝原假设H0,说明在置信水平为95%下,回归方程显著。
(5)对每一回归系数做显著性检验
第二题中已经得到结果
系数a |
||||||
模型 |
未标准化系数 |
标准化系数 |
t |
显著性 |
||
B |
标准错误 |
Beta |
||||
1 |
(常量) |
-348.280 |
176.459 |
|
-1.974 |
.096 |
工业总产值 |
3.754 |
1.933 |
.385 |
1.942 |
.100 |
|
农业总产值 |
7.101 |
2.880 |
.535 |
2.465 |
.049 |
|
居民非商品支出 |
12.447 |
10.569 |
.277 |
1.178 |
.284 |
|
a. 因变量:货运总量 |
做t 检验:设原假设为
Ti统计量服从自由度n-p-1=10-3-1=6的t分布,给定显著性水平0.05,查得单侧检验临界值为1.943,
X1的t值=1.942<1.943,接受原假设认为系数不显著,
X2的t值为2.465>1.943,处在拒绝域,拒绝原假设,认为系数显著,
X3的t值为1.178<1.943,接受原假设,认为系数不显著;
在显著性水平α=0.05时,只有X2的P值检验<0.05,通过检验,即只有X2的回归系数较为显著,X1和X3的系数不显著
(6)如果有回归系数没有通过显著性检验,将其剔除,重新建立回归方程,再做回归方程de显著性检验和回归系数的显著性检验
估计模型参数,分析>-回归>-线性>-输入(后退)
排除的变量a |
||||||
模型 |
输入 Beta |
t |
显著性 |
偏相关 |
共线性统计 |
|
容差 |
||||||
2 |
居民非商品支出 |
.277b |
1.178 |
.284 |
.433 |
.586 |
a. 因变量:货运总量 |
||||||
b. 模型中的预测变量:(常量), 工业总产值, 农业总产值 |
||||||
系数a |
||||||
模型 |
未标准化系数 |
标准化系数 |
t |
显著性 |
||
B |
标准错误 |
Beta |
||||
1 |
(常量) |
-348.280 |
176.459 |
|
-1.974 |
.096 |
工业总产值 |
3.754 |
1.933 |
.385 |
1.942 |
.100 |
|
农业总产值 |
7.101 |
2.880 |
.535 |
2.465 |
.049 |
|
居民非商品支出 |
12.447 |
10.569 |
.277 |
1.178 |
.284 |
|
2 |
(常量) |
-459.624 |
153.058 |
|
-3.003 |
.020 |
工业总产值 |
4.676 |
1.816 |
.479 |
2.575 |
.037 |
|
农业总产值 |
8.971 |
2.468 |
.676 |
3.634 |
.008 |
|
a. 因变量:货运总量 |
函数方程为
模型摘要 |
||||
模型 |
R |
R 方 |
调整后 R 方 |
标准估算的错误 |
1 |
.898a |
.806 |
.708 |
23.442 |
2 |
.872b |
.761 |
.692 |
24.081 |
a. 预测变量:(常量), 居民非商品支出, 工业总产值, 农业总产值 |
||||
b. 预测变量:(常量), 工业总产值, 农业总产值 |
ANOVAa |
||||||
模型 |
平方和 |
自由度 |
均方 |
F |
显著性 |
|
1 |
回归 |
13655.370 |
3 |
4551.790 |
8.283 |
.015b |
残差 |
3297.130 |
6 |
549.522 |
|
|
|
总计 |
16952.500 |
9 |
|
|
|
|
2 |
回归 |
12893.199 |
2 |
6446.600 |
11.117 |
.007c |
残差 |
4059.301 |
7 |
579.900 |
|
|
|
总计 |
16952.500 |
9 |
|
|
|
|
a. 因变量:货运总量 |
||||||
b. 预测变量:(常量), 居民非商品支出, 工业总产值, 农业总产值 |
||||||
c. 预测变量:(常量), 工业总产值, 农业总产值 |
原假设:
F服从自由度为(2,7)的F分布,给定显著性水平α=0.05,查表得F0.05(2,7)=4.74,由方差分析表F值=11.117>4.74,P值=0.007,拒绝原假设H0
认为在显著性水平α=0.05下,X1,X2整体上对y有显著的线性影响,即回归方程是显著的。
系数a |
||||||
模型 |
未标准化系数 |
标准化系数 |
t |
显著性 |
||
B |
标准错误 |
Beta |
||||
1 |
(常量) |
-348.280 |
176.459 |
|
-1.974 |
.096 |
工业总产值 |
3.754 |
1.933 |
.385 |
1.942 |
.100 |
|
农业总产值 |
7.101 |
2.880 |
.535 |
2.465 |
.049 |
|
居民非商品支出 |
12.447 |
10.569 |
.277 |
1.178 |
.284 |
|
2 |
(常量) |
-459.624 |
153.058 |
|
-3.003 |
.020 |
工业总产值 |
4.676 |
1.816 |
.479 |
2.575 |
.037 |
|
农业总产值 |
8.971 |
2.468 |
.676 |
3.634 |
.008 |
|
a. 因变量:货运总量 |
做t 检验:设原假设为
Ti统计量服从自由度n-p-1=10-2-1=7的t分布,给定显著性水平0.05,查得单侧检验临界值为1.895,
X1的t值=2.575>1.895,拒绝原假设,认为系数显著,
X2的t值为3.634>1.895, 拒绝原假设,认为系数显著
在显著性水平α=0.05时,X1,X2的P值检验<0.05,通过检验,即X1 X2的回归系数较为显著T检验与P值检验结果一致
系数a |
||||||||
模型 |
未标准化系数 |
标准化系数 |
t |
显著性 |
B 的 95.0% 置信区间 |
|||
B |
标准错误 |
Beta |
下限 |
上限 |
||||
1 |
(常量) |
-348.280 |
176.459 |
|
-1.974 |
.096 |
-780.060 |
83.500 |
工业总产值 |
3.754 |
1.933 |
.385 |
1.942 |
.100 |
-.977 |
8.485 |
|
农业总产值 |
7.101 |
2.880 |
.535 |
2.465 |
.049 |
.053 |
14.149 |
|
居民非商品支出 |
12.447 |
10.569 |
.277 |
1.178 |
.284 |
-13.415 |
38.310 |
|
2 |
(常量) |
-459.624 |
153.058 |
|
-3.003 |
.020 |
-821.547 |
-97.700 |
工业总产值 |
4.676 |
1.816 |
.479 |
2.575 |
.037 |
.381 |
8.970 |
|
农业总产值 |
8.971 |
2.468 |
.676 |
3.634 |
.008 |
3.134 |
14.808 |
|
a. 因变量:货运总量 |
可得到置信区间
的95%置信区间是[0.381,8.970]
的95%置信区间是[3.134,14.808]
由上表知道标准化后的回归方程为: