为什么数字会撒谎?(相关性)

问题1、相关性是要计算的,不是靠猜的。

以下来源于运营的数据分析报告:

目前企业买家订单数占比很低,导致没有吸引更多的注册企业买家购买的原因是不是***还不够好,****不合适,****不贴合企业买家,企业买家采购决策周期性等,这些问题值得我们好好思考。

为什么订单量低,原因可能有很多很多,有经验有感觉是无比珍贵的能力,但缺陷是我们也需要引入一些理性的方法,比如——相关系数,有根据的假设,对工作有指导意义,这才是分析的目的。

相关性体现的是两个现象之间相互关联的程度。

如果其中一个变量的改变引发另一个变量朝着相同的方向变化,那么我们说这两个变量存在正相关性,比如天热,吃冷饮的人就多;

如果一个变量的改变引发另一个变量朝着相反的方向变化,那么这两个变量就存在负相关性,比如健身与体重,keep 1个月,体重减少2斤。

如果两个变量无论在什么分析模式下都无法呈现出规律,那么这两个变量之间就不存在或基本不存在相关性。但问题是很多时候,现实情况要复杂的多,比如天冷也有很多人去吃冷饮;有的人健身一个月,体重没变化,甚至还胖了。那究竟该如何描述关联程度呢?

相关系数,它是一个区间为-1到1的常数。

如果相关系数为1,即完全相关,表示一个变量的任何改变都会导致另一个变量朝着相同方向发生等量的改变。

如果相关系数为-1,即完全负相关,代表一个变量的任何变化都将会引发另一个变量朝着相反方向发生等量的改变。

如果相关系数为零(或者接近零),则意味着变量之间不存在有意义的联系。

计算方法不复杂,Excel 直接有公式。

问题2:相关关系并不等于因果关系。

上述的运营数据报告里还提到一点:

从买家带来的订单数来看买家的推广渠道,效果比较好的是 EDM 和 Google 两个渠道。

如果从这样的表达中我们得出:买家看了 EDM 才下了订单,因此 EDM 这个渠道很好。

其他假设成立吗?比如  ——

①  下单的用户,本身就已经对网站比较关注,因此才会看EDM ?

②  从没有下订单的买家来看推广渠道,他们其实也看了EDM,或者也来源于Google,因此可以说 EDM跟 Google 的效果并不好。

订单数与渠道有相关关系,并不代表其中一个变量的改变是由另一个变量的变化引起。

产品经理如果不能跳出这个思维误区,放弃了后续相关条件的比较跟踪;或者是始终不能在相对全面公平的条件下进行对比,的确在上述案例中容易造成一个既定印象:多多发 EDM,多多投放 Google 广告,订单自然增加。

你可能感兴趣的:(为什么数字会撒谎?(相关性))