教材P119第2题2)部分,使用R语言进行计算
(程序代码及运行结果截屏插入到该word文档,并且对结果进行解释)。
1.某家房地产公司的总裁想了解为什么公司中的某些分公司比其他分公司表现出色,他认为决定总年销售额(以百万元计)的关键因素是广告因素(以千元计)和销售代理的数目。为了分析这种情况,他抽取了8家分公司作为样本,搜集了表所示的数据
在5%的显著水平下确定每一解释变量与依赖变量间是否呈线性关系。
表:某房地产公司8家分公司年销售额、广告预算与代理数数据
分公司 | 广告预算/千元 | 代理数 | 年销售额/百万元 |
---|---|---|---|
1 | 249 | 15 | 32 |
2 | 183 | 14 | 18 |
3 | 310 | 21 | 49 |
4 | 246 | 18 | 52 |
5 | 288 | 13 | 36 |
6 | 248 | 21 | 43 |
7 | 256 | 20 | 24 |
8 | 241 | 19 | 41 |
解:
建立多元线性回归方程 y = β 0 + β 1 ∗ x 1 + β 2 ∗ x 2 + ε y =\beta_0+\beta_1*x_1+\beta_2*x_2+\varepsilon y=β0+β1∗x1+β2∗x2+ε
输入数据,调用 l m lm lm函数求解
> x1=c(249,183,310,246,288,248,256,241)
> x2=c(15,14,21,18,13,21,20,19)
> y=c(32,18,49,52,36,43,24,41)
> (myLm=lm(y~x1+x2,data=data.frame(y=y,x1=x1,x2=x2)))
即拟合的线性方程为 y = − 22.7450 + 0.1511 ∗ x 1 + 1.2166 ∗ x 2 + ε y =-22.7450+0.1511*x_1+1.2166*x_2+\varepsilon y=−22.7450+0.1511∗x1+1.2166∗x2+ε
使用 s u m m a r y summary summary函数显示计算结果
> summary(myLm)
接下来进行显著性检验( t t t检验)
不妨做以下假设: H 0 : β i = 0 , H 1 : β i ≠ 0 H_0:\beta_i=0,H_1:\beta_i\neq0 H0:βi=0,H1:βi=0
由t检验结果可知, p = 0.2412 > α = 0.05 p=0.2412>\alpha=0.05 p=0.2412>α=0.05
所以接受假设 H 0 H_0 H0,认为 β i = 0 \beta_i=0 βi=0 ,说明自变量 x i x_i xi与 y y y不存在统计意义下显著的线性相关关系