spss 实用回归分析 多元线性回归模型 研究货运总量与工业总产值4.8题

4.8 (1)计算y,X1,X2,X3的相关系数矩阵

spss 实用回归分析 多元线性回归模型 研究货运总量与工业总产值4.8题_第1张图片

分析>-相关>-双变量>-拖入变量>-其他保持默认

输出结果

相关性

 

货运总量

工业总产值

农业总产值

居民非商品支出

货运总量

皮尔逊相关性

1

.556

.731*

.724*

Sig.(双尾)

 

.095

.016

.018

个案数

10

10

10

10

工业总产值

皮尔逊相关性

.556

1

.113

.398

Sig.(双尾)

.095

 

.756

.254

个案数

10

10

10

10

农业总产值

皮尔逊相关性

.731*

.113

1

.547

Sig.(双尾)

.016

.756

 

.101

个案数

10

10

10

10

居民非商品支出

皮尔逊相关性

.724*

.398

.547

1

Sig.(双尾)

.018

.254

.101

 

个案数

10

10

10

10

*. 在 0.05 级别(双尾),相关性显著。

每行皮尔逊相关性组成相关矩阵

                                          r=\begin{bmatrix} 1.000&0.556 & 0.731 &0.724 \\ 0.556& 1.000 &0.113 &0.398 \\ 0.731 & 0.113 &1.000 & 0.547\\ 0.724&0.398 & 0.547 &1.000 \end{bmatrix}

(2)求y关于X1,X2,X3的三元线性回归方程

分析>-回归>-线性>-拖入自变量因变量,其他保持默认

输出结果

系数a

模型

未标准化系数

标准化系数

t

显著性

B

标准错误

Beta

1

(常量)

-348.280

176.459

 

-1.974

.096

工业总产值

3.754

1.933

.385

1.942

.100

农业总产值

7.101

2.880

.535

2.465

.049

居民非商品支出

12.447

10.569

.277

1.178

.284

a. 因变量:货运总量

得到系数B列

则三元线性回归方程为

                                 y=-348.280+3.754X_{1}+7.101X_{2}+12.447X_{3} 

(3)对所求方程做拟合优度检验

上面操作中也出现了

模型摘要

模型

R

R

调整后 R 方

标准估算的错误

1

.898a

.806

.708

23.442

a. 预测变量:(常量), 居民非商品支出, 工业总产值, 农业总产值

调整后的决定系数为0.708,说明回归方程对样本观测值的拟合程度较好

(4)对回归方程做显著性检验

 

ANOVAa

模型

平方和

自由度

均方

F

显著性

1

回归

13655.370

3

4551.790

8.283

.015b

残差

3297.130

6

549.522

 

 

总计

16952.500

9

 

 

 

a. 因变量:货运总量

b. 预测变量:(常量), 居民非商品支出, 工业总产值, 农业总产值

原假设:

                                                         H0:\beta 1=\beta 2=\beta 3=0 

F统计量服从自由度为(3,6)的F分布,给定显著性水平

                                                               \alpha =0.05 

查表得

                                                         F_{0.05}(3,6)=4.76

由方差分析表得F值=8.2834.76,P值等于0.015<显著性水平,落在拒绝域,拒绝原假设H0,说明在置信水平为95%下,回归方程显著。

(5)对每一回归系数做显著性检验

第二题中已经得到结果

系数a

模型

未标准化系数

标准化系数

t

显著性

B

标准错误

Beta

1

(常量)

-348.280

176.459

 

-1.974

.096

工业总产值

3.754

1.933

.385

1.942

.100

农业总产值

7.101

2.880

.535

2.465

.049

居民非商品支出

12.447

10.569

.277

1.178

.284

a. 因变量:货运总量

做t 检验:设原假设为

                                                             H0:\beta i=0 

Ti统计量服从自由度n-p-1=10-3-1=6的t分布,给定显著性水平0.05,查得单侧检验临界值为1.943,

X1的t值=1.942<1.943,接受原假设认为系数不显著,

X2的t值为2.465>1.943,处在拒绝域,拒绝原假设,认为系数显著,

X3的t值为1.178<1.943,接受原假设,认为系数不显著;

在显著性水平α=0.05时,只有X2的P值检验<0.05,通过检验,即只有X2的回归系数较为显著,X1和X3的系数不显著

(6)如果有回归系数没有通过显著性检验,将其剔除,重新建立回归方程,再做回归方程de显著性检验和回归系数的显著性检验

估计模型参数,分析>-回归>-线性>-输入(后退)

spss 实用回归分析 多元线性回归模型 研究货运总量与工业总产值4.8题_第2张图片spss 实用回归分析 多元线性回归模型 研究货运总量与工业总产值4.8题_第3张图片

排除的变量a

模型

输入 Beta

t

显著性

偏相关

共线性统计

容差

2

居民非商品支出

.277b

1.178

.284

.433

.586

a. 因变量:货运总量

b. 模型中的预测变量:(常量), 工业总产值, 农业总产值

             

 

 

 

系数a

模型

未标准化系数

标准化系数

t

显著性

B

标准错误

Beta

1

(常量)

-348.280

176.459

 

-1.974

.096

工业总产值

3.754

1.933

.385

1.942

.100

农业总产值

7.101

2.880

.535

2.465

.049

居民非商品支出

12.447

10.569

.277

1.178

.284

2

(常量)

-459.624

153.058

 

-3.003

.020

工业总产值

4.676

1.816

.479

2.575

.037

农业总产值

8.971

2.468

.676

3.634

.008

a. 因变量:货运总量

函数方程为

                                          y=-459.624+4.676X_{1}+8.971X_{2}

 

 

模型摘要

模型

R

R

调整后 R 方

标准估算的错误

1

.898a

.806

.708

23.442

2

.872b

.761

.692

24.081

a. 预测变量:(常量), 居民非商品支出, 工业总产值, 农业总产值

b. 预测变量:(常量), 工业总产值, 农业总产值

 

ANOVAa

模型

平方和

自由度

均方

F

显著性

1

回归

13655.370

3

4551.790

8.283

.015b

残差

3297.130

6

549.522

 

 

总计

16952.500

9

 

 

 

2

回归

12893.199

2

6446.600

11.117

.007c

残差

4059.301

7

579.900

 

 

总计

16952.500

9

 

 

 

a. 因变量:货运总量

b. 预测变量:(常量), 居民非商品支出, 工业总产值, 农业总产值

c. 预测变量:(常量), 工业总产值, 农业总产值

 

原假设:   H0:\beta 1=\beta 2=0 

F服从自由度为(2,7)的F分布,给定显著性水平α=0.05,查表得F0.05(2,7)=4.74,由方差分析表F值=11.117>4.74,P值=0.007,拒绝原假设H0

认为在显著性水平α=0.05下,X1,X2整体上对y有显著的线性影响,即回归方程是显著的。

 

系数a

模型

未标准化系数

标准化系数

t

显著性

B

标准错误

Beta

1

(常量)

-348.280

176.459

 

-1.974

.096

工业总产值

3.754

1.933

.385

1.942

.100

农业总产值

7.101

2.880

.535

2.465

.049

居民非商品支出

12.447

10.569

.277

1.178

.284

2

(常量)

-459.624

153.058

 

-3.003

.020

工业总产值

4.676

1.816

.479

2.575

.037

农业总产值

8.971

2.468

.676

3.634

.008

a. 因变量:货运总量

做t 检验:设原假设为

                                                             H0:\beta 1=0 

Ti统计量服从自由度n-p-1=10-2-1=7的t分布,给定显著性水平0.05,查得单侧检验临界值为1.895,

X1的t值=2.575>1.895,拒绝原假设,认为系数显著,

X2的t值为3.634>1.895, 拒绝原假设,认为系数显著

在显著性水平α=0.05时,X1,X2的P值检验<0.05,通过检验,即X1  X2的回归系数较为显著T检验与P值检验结果一致

 

系数a

模型

未标准化系数

标准化系数

t

显著性

B 的 95.0% 置信区间

B

标准错误

Beta

下限

上限

1

(常量)

-348.280

176.459

 

-1.974

.096

-780.060

83.500

工业总产值

3.754

1.933

.385

1.942

.100

-.977

8.485

农业总产值

7.101

2.880

.535

2.465

.049

.053

14.149

居民非商品支出

12.447

10.569

.277

1.178

.284

-13.415

38.310

2

(常量)

-459.624

153.058

 

-3.003

.020

-821.547

-97.700

工业总产值

4.676

1.816

.479

2.575

.037

.381

8.970

农业总产值

8.971

2.468

.676

3.634

.008

3.134

14.808

a. 因变量:货运总量

可得到置信区间

                                       \beta 1 的95%置信区间是[0.381,8.970]

                                      \beta 2 的95%置信区间是[3.134,14.808]

由上表知道标准化后的回归方程为:

                                                 y*=0.479X_{1}*+0.676X_{2}*

你可能感兴趣的:(矩阵)