数据分析系列 9/32 | Excel进行回归分析,预测真实值

image

前面学习了Excel中的相关分析,在数据分析中,相关分析和回归分析关系紧密,今天来学习下Excel中的回归分析。

image

PART

01

回归分析

回归分析(regressionanalysis)是确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法。

我们在得到两组数据之间的相关程度之后,就可以使用回归分析进行预测了,换言之,相关分析是回归分析的基础和前提,回归分析是相关分析的深入和继续。但只有当数据之间存在高度相关时,进行回归分析寻求相关的具体形式才有意义。

****回归分析分类****

在我们的日常数据分析过程中,回归分析是应用十分广泛的一种数据分析方法,该方法主要用于分析单个因变量是如何受到一个或多个自变量影响的。如分析某个产品的销售情况与产品质量、价格、促销活动、天气等因素之间的关系。根据已知的一组数据,我们就可以知道这几个因素对销售额的影响,然后对同类产品的销售额进行预测。

回归分析的分类如下图1所示:

image
image

PART

02

多元线性回归分析

1、实例描述

某品牌汽车经销商的经理了解到投放广告对于汽车销售额增长具有很大的作用,但是他并不明确在电视台投放广告与在各个视频网站投放广告哪种方式对增加汽车销售额更有效。在2017年1月,若在电视台和视频网站分别投入的广告费为20万和30万,那么应估算汽车的销售额为多少万元?针对这种情况,经理收集本公司去年各月的汽车销售额数据及每月在以上两种媒介上投入的广告费用数据,如下图2所示。

image

2、实例分析

简单根据上面的数据,我们并不能确定这两种广告投放渠道哪种更有效,所以,这里我们使用Excel中的回归分析方法,先检验这两组数据与销售额的相关性程度,随后再根据回归分析过程中所得到的线性回归方程预测确定广告费时的销售额。

3、操作分析

使用Excel进行多元线性回归分析的因变量是销售额,自变量是两种渠道的广告费,具体步骤如下:

第1步:选择回归分析工具并设置参数。打开“数据分析”对话框,选择“回归”分析工具,单击“确定”,如图3所示,弹出“回归”对话框,设置“Y值输入区域”为“2:14”,“X值输入区域”为“2:14”;勾选“标志”“置信度”复选框,并设置置信度为“95%”;单击“输出区域”,并设置该区域为“1”;单击确定即可。如图4所示。

image
image

第2步:显示回归分析结果。此时返回工作表,就能得到详细的各项参数值。如图5所示。

image

操作解析:
  回归分析的计算结果一共包括三个模块:
  (1)第一个模块为回归统计表,其中主要包含MultipleR、RSquare、AdjustedRSquare、标准误差和观测值。MultipleR为复相关系数,也就是前面说的相关系数,用来衡量x和y之间的相关程度大小,RSquare为复测定系数R2,其用来说明自变量解释因变量变差的程度,从而测量同因变量y的拟合效果,AdjustedRSquare为调整后的复测定系数R2,标准误差衡量拟合程度大小,值越小,说明拟合程度越好,观测值指的是用于估计回归方程数据的观测值个数。

(2)第二个模块为方差分析表。其主要作用是通过假设检验中的F-检验来判断回归模型的回归效果。

(3)第三个模块是回归参数表。第一列表示截距,第二列表示对应模型的回归系数,包括了截距和斜率,可以根据这个建立回归模型。第三列为回归系数的标准误差,值越小,表明参数的精确度越高,第四列对应的是统计量t值,用于检验模型参数。第五列为各个回归系数的P值,当P<0.05时,可以认为模型在α=0.05的水平上显著,或置信度达到了95%。最后几列为回归系数置信区间的上限和下限。

4、决策分析

上面的结果中可以看到,R值为0.9813,表示广告支出费与销售额之间的关系为高度正相关,复测定系数为0.9630,表明用自变量可解释因变量变差的96.3%,AdjustedRSquare为0.9538,说明自变量能说明因变量的95.38%,因变量剩余的4.62%则由其他因素来解释。

回归参数表中,回归方程的截距和两个斜率分别为-359.48,9.35,52.46。又因为P值小于0.05,说明了这两个自变量对汽车销售额均有显著影响,但是,两个斜率中,视频网站对应的回归系数更大,说明在视频网站上投放广告更有效。

由此可得该回归分析的线性回归方程为:y=-359.48+9.35x1+52.46x2。

预测一下,当电视广告费和视频广告费分别为20万和30万时,汽车销售额的预测值为:y=-359.48+9.3520+52.4630=1401.32(万)。

欢迎关注,访问更多精彩:数据之魅

如需转载,请联系授权,谢谢合作。

你可能感兴趣的:(数据分析系列 9/32 | Excel进行回归分析,预测真实值)