制定对策,要依据“方程式”

现实工作中,人们需要根据数值采取行动。“为什么要进行分析”“计划根据分析结果做什么”,这些视点和思维方式,对实际业务中的数据分析工作具有极为重要的意义。

10 秒钟完成一元回归分析

(1)用散点图展现 2 个数据间的关系

(2)用散点图求回归方程

散点图上的回归方程和R 平方值(R 2 )

一元回归分析公式用y =ax +b 的形式来表现这条直线,这就是回归方程(由此画出的直线叫作回归直线)。

x 叫作“自变量”或“解释变量”,y 叫作“因变量”或“被解释变量

回归直线作为零散分布的原始数据的代表,是距离各点(数据)之和最小的直线。不过除非所有数据都排列在同一条直线上,否则回归方程与各点之间就一定会有偏差。就这一点而言,回归方程无法完美地体现原始数据。

如果原始数据完全相关(相关系数=1),那么所有的点都会排列在一条直线上;但如果不是完全相关,相关系数就会随着数据对完全相关(直线)的偏离,从 1 开始逐渐减小。其实,越偏离直线,指标越小于 1 的现象也适用于一元回归。数据偏离越远,回归直线就越不能准确地代表原始数据,R 2 表示数据的偏离程度。

关注相关系数的平方

R 2 就是相关系数的平方。因此我们对R 2 也可以采取与相关系数相同的评价标准。如果用百分数(%)表示R 2 ,它可以理解为“被解释变量”在多大程度上可以由“解释变量”来说明。

知道达到目标所需要的输入(为多少,就可以计算出需要多少资源,或者据此设定行动指标(KPI:重要业绩评价指标),从而制定出更为客观并符合逻辑的计划。

注意事项及应用事例

运用一元回归分析要注意以下两个问题。

一个是“数据之间必须具有单纯的比例关系”。与相关分析一样,一元回归分析的大前提是 2 个数据之间存在直线比例关系。情况或关系越复杂,就越不符合严密的线性关系。这种情况就不适合套用y =ax +b 。

还有一个需注意的问题,即“离群值以及不同的数据选择范围,会导致分析结果产生很大不同”。这一点也与相关分析的注意事项一样。是否采纳明显偏离其他数据的“离群值”,如何设定数据的范围,分析者的不同判断会导致分析结果出现很大差异。也就是说,分析者每一个小小的决定都能操纵分析的结果。

看相关系数还是看斜率

相关系数常作为筛选标准,与 0.7、0.5 等界限值进行比较,只要高于界限值就可以判断是相关。由于其中会包含误差等,所以并不按照其具体大小进行判断。对已经确定具有相关关系的数据,则可以运用回归分析来定量地比较或评价其影响。也就是说,可以从 2 个视角来看,用相关分析判断关联的紧密程度,用回归分析判断其影响大小。

你可能感兴趣的:(制定对策,要依据“方程式”)