1.一家保险公司想了解其总公司营业部加班时间与签发的新保单数目之间的关系,经过10周时间,收集了每周加班工作时间y(小时)和签发的新保单数目x(张)。
ee4.1=read.table("clipboard",header = T)
ee4.1
plot(ee4.1,main = '散点图', xlab = '保险单数',ylab = '工作时间')
cor(ee4.1)
lm4.1 <- lm(ee4.1)
lm4.1
square_sigma <- t(e4.1)/(10-1-1)
square_sigma
y = c(3.5,1,4,2,1,3,4.5,1.5,3,5)
x = c(825,215,1070,550,480,920,1350,325,670,1215)
y_hat <- 46.15 + 251.17*y
s <- t(y_hat - x)%*%(y_hat - x)/(10-1-1)
s
(summary(lm4.1) $ s)^2
SR <- t(y_hat - mean(x))%*%(y_hat - mean(x))
ST <- t(x - mean(x))%*%(x - mean(x))
s_R <- SR/ST
s_R
(summary(lm4.1) $ r.squared)
anova(lm4.1)
res <- residuals(lm4.1)
res
plot(y,res,main='残差散点图',xlab='每周签发的新保单数目',ylab='残差')
plot(lm4.1)
lm4.1_1 <- lm(x ~ y,data = ee4.1)
predict(lm4.1_1,newdata = data.frame(y = 1000))
lm4.1_1 <- lm(y ~ x,data = ee4.1)
predict(lm4.1_1,newdata = data.frame(x = 1000))
(1)绘制散点图,并以此判断x与y之间是否大致呈线性关系。
(2)计算x与y的相关系数。
(3)用最小二乘估计法求回归方程。
x = 251.17y + 46.15
(4)求随机误差ε的方差σ^2的估计值。
(5)计算x与y的决定系数。
(6)对回归方程作方差分析。
P<0.05,x与y间存在直线回归关系 。
(7)对回归方程作残差图并做一些分析。
(8)计算x0 = 1000(张)需要的加班时间是多少?
2.某家房地产公司的总裁想了解为什么公司中的某些分公司比其他公司表现出色,他认为决定总年销售额(以百万元计)的关键因素是广告预算(以千元计)和销售代理的数目。为了分析这种情况,他抽取了8家公司作为样本。
(1)做回归模型并解释各系数
多元线性方程:y = -22.75 + 0.1511 x1 + 1.2166 x2
标准化偏回归系数为
x1:0.4741293。
x2:0.3300133。
由标准化偏回归系数可见,广告预算和销售代理的数目对年销售额的线性影响还是挺大的
(2)在5%的显著水平下确定每一解释变量与依赖变量是否呈线性关系
H0:x与y没有显著的线性关系.
P=>0.05,说明x与y没有显著的线性关系
(3)计算简单相关系数和复相关系数
3.学校毕业生起始工资的变化是否能用学生的平均成绩点数(GPA)和毕业时的年龄来解释。
e4.3 = read.table("clipboard",header = T)
e4.3
(lm4.3 = lm(起始工资~ GPA + 年龄,data = e4.3))
summary(lm4.3)
R4.3 = summary(lm4.3) $ r.sq
R4.3
R_2_4.3 = sqrt(R4.3)
R_2_4.3
predict(lm4.3,newdata = data.frame(GPA = 3,年龄 = 24))
(1)试做回归模型并解释各系数。
起始工资 = -5213.1 + 8508.8 GPA + 181.6
(2)确定学生的GPA和年龄是否能真正用来解释起始工资样本的变化。
(3)预测某GPA为3.00,年龄为24岁的毕业生的起始工资。
4.研究货运总量y(万吨)与工业总产值x1(亿元)、农业总产值x2(亿元)、居民非商品支出x3(亿元)的关系。
(1)计算y,x1,x2,x3的相关系数矩阵并绘制矩阵散点图。
(2)求y关于x1,x2,x3的多元线性回归方程。
得到y = -348.280+3.754x1+7.101x2+12.447X3
(3)对所求得的方程做拟合优度检验
R^2=Multiple R-squared=0.8055接近1,说明回归方程拟合度高。
R^2=Multiple R-squared=0.8055接近1,说明回归方程拟合度高。
R=0.8975>R0.05(8)=0.632,所以接受原假设,说明x与y有显著的线性关系
(4)对回归方程做显著性检验,对每一个回归系数做显著性检验
H0:x与y没有显著的线性关系。
P=<0.05,说明x与y有显著的线性关系
(5)如果有的回归系数没通过显著性检验,将其剔除,重新建立回归方程,再做回归方程的显著性检验和回归系数的显著性检验。
P3=0.2835最大,剔除x3,建立新的回归方程。
重新建立回归方程y=-459.624+4.676x1+8.971x2 对新的回归方程做显著性检验。 提出原假设H0=β1=β2=0。
P=<0.05,说明x与y有显著的线性关系。
P1=<0.05,说明x1对y有显著的影响;
P2=<0.05,说明x2对y有显著的影响。
(6)使用逐步回归分析的逐步筛选方法获得一个最优的回归模型。