R语言与多元线性回归分析计算实例

6.3.7 计算实例

例 6.9 某大型牙膏制造企业为了更好地拓展产品市场,有效地管理库存,公司董事会要求销售部门根据市场调查,找出公司生产的牙膏销售量与销售价格,广告投入等之间的关系,从而预测出在不同价格和广告费用下销售量。为此,销售部门的研究人员收集了过去30个销售周期(每个销售周期为4周)公司生产的牙膏的销售量、销售价格、投入的广告费用,以及周期其他厂家生产同类牙膏的市场平均销售价格,如表6.4所示。

试根据这些数据建立一个数学模型,分析牙膏销售量与其他因素的关系,为制订价格策略和广告投入策略提供数量依据。

R语言与多元线性回归分析计算实例_第1张图片

R语言与多元线性回归分析计算实例_第2张图片

分析

由于牙膏是生活的必需品,对于大多数顾客来说,在购买同类牙膏时,更多的会关心不同品牌之间的价格差,而不是它们的价格本身。因此,在研究各个因素对销售量的影响时,用价格差代替公司销售价格和其他厂家平均价格更为合适

模型的建立与求解

记牙膏销售量为Y,价格差为X1,公司的广告费为X2,假设基本模型为线性模型:

image

输入数据,调用R软件中的lm()函数求解,并用summary()显示计算结果(程序名:exam0609.R)

R语言与多元线性回归分析计算实例_第3张图片

计算结果通过线性回归系数检验和回归方程检验,由此得到销售量与价格差与广告费之间的关系为:

image

模型的进一步分析

为进一步分析回归模型,我们画出y与x1和y与x2散点图。从散点图上可以看出,对于y与x1,用直线拟合较好。而对于y与x2,则用二次曲线拟合较好,如下图:

绘制x1与y的散点图和回归直线

R语言与多元线性回归分析计算实例_第4张图片

绘制x2与y的散点图和回归曲线

R语言与多元线性回归分析计算实例_第5张图片

其中 I(X2^2),表示模型中X2的平方项,及X22,从上图中,将销售量模型改为:

image

似乎更合理,我们做相应的回归分析:

R语言与多元线性回归分析计算实例_第6张图片

此时,我们发现,模型残差的标准差Residual standard error有所下降,相关系数的平方Multiple R-squared有所上升,这说明模型修正的是合理的。但同时也出现了一个问题,就是对于β2的P-值>0.05。为进一步分析,做β的区间估计。

R语言与多元线性回归分析计算实例_第7张图片

如上错误出现????!!!!直接引用结果如下:

R语言与多元线性回归分析计算实例_第8张图片

β2的区间估计为[ –7.49886317, 0.1076898 ],它包含了0,也就是说,β2的值可能为0. 因此,去掉X2的一次项,在进行分析:

R语言与多元线性回归分析计算实例_第9张图片

此模型虽然通过了F检验和T检验,但与上一模型对比来看,Residual standard error上升,Multiple R-squared下降。这又是此模型的不足之处。

在做进一步的修正,考虑X1和X2交互作用,及模型为:

image

R语言与多元线性回归分析计算实例_第10张图片

模型通过T检验和F检验,并且Residual standard error减少,Multiple R-squared增加。因此,最终模型选为:

image

你可能感兴趣的:(R语言与机器学习)