多元统计分析及R语言建模(第四版)--第四章多元相关与回归分析及R使用课后习题

1.一家保险公司想了解其总公司营业部加班时间与签发的新保单数目之间的关系,经过10周时间,收集了每周加班工作时间y(小时)和签发的新保单数目x(张)。

 

ee4.1=read.table("clipboard",header = T)
ee4.1
plot(ee4.1,main = '散点图', xlab = '保险单数',ylab = '工作时间')
cor(ee4.1)
lm4.1 <- lm(ee4.1)
lm4.1
square_sigma <- t(e4.1)/(10-1-1)
square_sigma
y = c(3.5,1,4,2,1,3,4.5,1.5,3,5)
x = c(825,215,1070,550,480,920,1350,325,670,1215)
y_hat <- 46.15 + 251.17*y
s <- t(y_hat - x)%*%(y_hat - x)/(10-1-1)
s
(summary(lm4.1) $ s)^2
SR <- t(y_hat - mean(x))%*%(y_hat - mean(x))
ST <- t(x - mean(x))%*%(x - mean(x))
s_R <- SR/ST
s_R
(summary(lm4.1) $ r.squared)
anova(lm4.1)
res <- residuals(lm4.1)
res
plot(y,res,main='残差散点图',xlab='每周签发的新保单数目',ylab='残差')
plot(lm4.1)
lm4.1_1 <- lm(x ~ y,data = ee4.1)
predict(lm4.1_1,newdata = data.frame(y = 1000))
lm4.1_1 <- lm(y ~ x,data = ee4.1)
predict(lm4.1_1,newdata = data.frame(x = 1000))

(1)绘制散点图,并以此判断x与y之间是否大致呈线性关系。

多元统计分析及R语言建模(第四版)--第四章多元相关与回归分析及R使用课后习题_第1张图片

(2)计算x与y的相关系数。

多元统计分析及R语言建模(第四版)--第四章多元相关与回归分析及R使用课后习题_第2张图片

(3)用最小二乘估计法求回归方程。

多元统计分析及R语言建模(第四版)--第四章多元相关与回归分析及R使用课后习题_第3张图片

x = 251.17y + 46.15

(4)求随机误差ε的方差σ^2的估计值。

多元统计分析及R语言建模(第四版)--第四章多元相关与回归分析及R使用课后习题_第4张图片

(5)计算x与y的决定系数。 

 多元统计分析及R语言建模(第四版)--第四章多元相关与回归分析及R使用课后习题_第5张图片

 (6)对回归方程作方差分析。

多元统计分析及R语言建模(第四版)--第四章多元相关与回归分析及R使用课后习题_第6张图片

P<0.05,x与y间存在直线回归关系 。

(7)对回归方程作残差图并做一些分析。

 多元统计分析及R语言建模(第四版)--第四章多元相关与回归分析及R使用课后习题_第7张图片

(8)计算x0 = 1000(张)需要的加班时间是多少? 

多元统计分析及R语言建模(第四版)--第四章多元相关与回归分析及R使用课后习题_第8张图片

 多元统计分析及R语言建模(第四版)--第四章多元相关与回归分析及R使用课后习题_第9张图片

2.某家房地产公司的总裁想了解为什么公司中的某些分公司比其他公司表现出色,他认为决定总年销售额(以百万元计)的关键因素是广告预算(以千元计)和销售代理的数目。为了分析这种情况,他抽取了8家公司作为样本。

(1)做回归模型并解释各系数

多元统计分析及R语言建模(第四版)--第四章多元相关与回归分析及R使用课后习题_第10张图片

多元线性方程:y = -22.75 + 0.1511 x1 + 1.2166 x2 

多元统计分析及R语言建模(第四版)--第四章多元相关与回归分析及R使用课后习题_第11张图片

标准化偏回归系数为
x1:0.4741293

x2:0.3300133
由标准化偏回归系数可见,广告预算和销售代理的数目对年销售额的线性影响还是挺大的

(2)在5%的显著水平下确定每一解释变量与依赖变量是否呈线性关系

H0:x与y没有显著的线性关系.

多元统计分析及R语言建模(第四版)--第四章多元相关与回归分析及R使用课后习题_第12张图片

P=>0.05,说明x与y没有显著的线性关系

(3)计算简单相关系数和复相关系数

多元统计分析及R语言建模(第四版)--第四章多元相关与回归分析及R使用课后习题_第13张图片

3.学校毕业生起始工资的变化是否能用学生的平均成绩点数(GPA)和毕业时的年龄来解释。

e4.3 = read.table("clipboard",header = T)
e4.3
(lm4.3 = lm(起始工资~ GPA + 年龄,data = e4.3))
summary(lm4.3)
R4.3 = summary(lm4.3) $ r.sq
R4.3
R_2_4.3 = sqrt(R4.3)
R_2_4.3
predict(lm4.3,newdata = data.frame(GPA = 3,年龄 = 24))

(1)试做回归模型并解释各系数。

多元统计分析及R语言建模(第四版)--第四章多元相关与回归分析及R使用课后习题_第14张图片

 多元统计分析及R语言建模(第四版)--第四章多元相关与回归分析及R使用课后习题_第15张图片

起始工资 = -5213.1 + 8508.8 GPA + 181.6 

(2)确定学生的GPA和年龄是否能真正用来解释起始工资样本的变化。

多元统计分析及R语言建模(第四版)--第四章多元相关与回归分析及R使用课后习题_第16张图片

(3)预测某GPA为3.00,年龄为24岁的毕业生的起始工资。

4.研究货运总量y(万吨)与工业总产值x1(亿元)、农业总产值x2(亿元)、居民非商品支出x3(亿元)的关系。

(1)计算y,x1,x2,x3的相关系数矩阵并绘制矩阵散点图。

多元统计分析及R语言建模(第四版)--第四章多元相关与回归分析及R使用课后习题_第17张图片

多元统计分析及R语言建模(第四版)--第四章多元相关与回归分析及R使用课后习题_第18张图片

(2)求y关于x1,x2,x3的多元线性回归方程。

多元统计分析及R语言建模(第四版)--第四章多元相关与回归分析及R使用课后习题_第19张图片

得到y = -348.280+3.754x1+7.101x2+12.447X3

(3)对所求得的方程做拟合优度检验

多元统计分析及R语言建模(第四版)--第四章多元相关与回归分析及R使用课后习题_第20张图片

R^2=Multiple R-squared=0.8055接近1,说明回归方程拟合度高。

R^2=Multiple R-squared=0.8055接近1,说明回归方程拟合度高。

R=0.8975>R0.05(8)=0.632,所以接受原假设,说明x与y有显著的线性关系

(4)对回归方程做显著性检验,对每一个回归系数做显著性检验

H0:x与y有显著的线性关系。

多元统计分析及R语言建模(第四版)--第四章多元相关与回归分析及R使用课后习题_第21张图片

P=<0.05,说明x与y有显著的线性关系

(5)如果有的回归系数没通过显著性检验,将其剔除,重新建立回归方程,再做回归方程的显著性检验和回归系数的显著性检验。

多元统计分析及R语言建模(第四版)--第四章多元相关与回归分析及R使用课后习题_第22张图片

P3=0.2835最大,剔除x3,建立新的回归方程。

多元统计分析及R语言建模(第四版)--第四章多元相关与回归分析及R使用课后习题_第23张图片

重新建立回归方程y=-459.624+4.676x1+8.971x2 对新的回归方程做显著性检验。 提出原假设H0=β1=β2=0。

多元统计分析及R语言建模(第四版)--第四章多元相关与回归分析及R使用课后习题_第24张图片

P=<0.05,说明x与y有显著的线性关系

P1=<0.05,说明x1对y有显著的影响;

P2=<0.05,说明x2对y有显著的影响。

(6)使用逐步回归分析的逐步筛选方法获得一个最优的回归模型。

多元统计分析及R语言建模(第四版)--第四章多元相关与回归分析及R使用课后习题_第25张图片

你可能感兴趣的:(r语言,开发语言,回归)