如何寻找事件背后的原因?

打开电视,看到一个护肤品的广告。
广告里的女明星皮肤细腻的看不到毛孔,整张脸白里透红,非常美丽。
这个时候打出一串广告语和护肤品的品牌。
你是否有些心动?
同样的场景还出现在洗发水广告中,那个拥有一头乌黑柔顺长发的女孩子告诉你,她使用的是XX品牌的洗发水。
你是否有些心动?
一位天使脸孔,魔鬼身材的模特告诉你,她就是吃某某代餐的,不仅肥肉没有了,皮肤也变好了。
你是否会心动?


记得曾经在《清醒思考的艺术》中看到过,人们往往会相信广告,是因为陷入了一个误区。
并不是因为广告里的明星、模特、气质美女不真实,而是你自己产生了因果偏误。
到底是因为模特的身材好,所以减肥产品才找到她做广告,还是因为模特真的是因为吃减肥产品才会有这么好的身材?
可见,减肥产品与模特身材之间并没有因果联系。
可能会有部分的关联关系,但是关联度有多大,不分析我们是无法得知的。

在我们做决策和判断的很多时候,都会被“因果偏误”误导。
比如觉得降价就会提升销量。
比如觉得访问量提高是因为优化了首页的配色。
比如觉得一个模块没有接到客户反馈是因为这个模块设计的非常完美。


记得在二战时期,美军对德国和日本法西斯展开了大规模战略轰炸,每天都有成千架轰炸机呼啸而去,返回时往往损失惨重。
美国空军对此十分头疼:如果要降低损失,就要往飞机上焊防弹钢板;但如果整个飞机都焊上钢板,速度航程载弹量什么都要受影响。
怎么办?
空军请来数学家沃尔德。
沃尔德的方法十分简单。
他把统计表发给地勤技师,让他们把飞机上弹洞的位置报上来,然后自己铺开一张大白纸,画出飞机的轮廓,再把那些小窟窿一个个添上去。
画完之后大家一看,飞机浑身上下都是窟窿,只有飞行员座舱和尾翼两个地方几乎是空白。
那么是不是应该在弹孔最多的地方焊上钢板呢?
沃尔德的选择是相反的。
沃尔德告诉大家:从数学家的眼光来看,这张图明显不符合概率分布的规律,而明显违反规律的地方往往就是问题的关键。
飞行员们一看就明白了:如果座舱中弹,飞行员就完了;尾翼中弹,飞机失去平衡就要坠落——这两处中弹,轰炸机多半就回不来了,难怪统计数据是一片空白。因此,结论很简单:只需要给这两个部位焊上钢板就行了。



同理,有很多时候我们找到的是关联关系,而不是因果关系。
而我们其实可以利用这种关联关系进行分析,去找出因果关系。
在《统计思维》中,作者就介绍了这种方法。
之所以分享给大家这种方法, 并不是说你一定要像数学家或者统计学家一样掌握各种方差、概率定理,而是要掌握这种统计学的思维。
不要再被关联关系迷惑,也就是《统计思维》中说的“冒失鬼”。

冒失鬼很有意思,总是很轻易的下结论。
“因为我们上个版本才更新了首页的设计,这周访问量就上来了,肯定是因为这次的首页设计更新的原因。”
“这个模块从来没有接到过用户的投诉或者需求,说明这个模块是那么的完美。”
但实际的情况很可能是,因为一个大V对这款软件的推荐,所以造成了访问量的上升。
因为这个模块根本没有人用,所以没有用户进行投诉或者提出需求。


那么怎么避免做个“冒失鬼”呢?
在《统计思维》中给出了一个进行统计分析的流程。
我觉得即便你不了解那么多的公式和理论,也可以将这个流程牢记于心进行应用。
因为它其实是描述了一种思维的方式。
如果你需要进一步的进行量化的分析,得到切实的数据支撑决策的话,可以再了解一些统计学理论的知识,或者求助专业人士。

1.找出可能的关联因素

在《统计思维》中说的比较专业:用多元回归分析/ Logistic 回归分析关联性。
我们不那么专业的话,可以通过其他的方式寻找关联因素。
比如:问卷。
比如:头脑风暴。
我们需要尽可能多的找到可能的关联因素。
比如访问量提升,是因为首页的改版、因为宣传、因为优惠措施、因为关联推荐、因为心血来潮、因为学生放假……

2.解释结果

我们尝试将之前找到的那么多可能的关联因素进行解释。
是否这样的原因真的会导致访问量上升的结果。

3. 分析

因为头脑风暴或者问卷等方式收集到的信息是比较庞杂、零散的,我们可以将这些信息进行分析、分组。
在这个过程中,可将可能性非常小的进行剔除。
那种显而易见的因素也可以剔除。
比如,每年学生放假的时候,访问量都会有小幅度的提升,但是不会有这么明显。
那么可以考虑“学生放假”可能不是产生本次大幅提升的主要因素。

4.对分析结果进行验证

《统计思维》中提到的是“用t检验或z检验验证A/B测试的结果。”
简单来说,因为我们想找到本次访问量大幅提升的原因,为了避免我们找到的是关联因素,所以我们需要进行反向验证。
比如,我们之前找到的一个因素是“因为某知名网站的关联推荐造成了访问量的提升”。
那我们就需要进行验证了,是因为某知名网站的关联推荐造成了访问量的提升,还是因为我们访问量提升了,从而让某知名网站对我们进行了关联推荐?

经过这四步的分析后,你基本可以确定原因是什么了。
这个原因可能不止一个因素。
而如果你想进一步知道这些因素哪些作为主要因素,哪些作为辅助因素,相互之间的关系是怎样的。
那么就需要用到专业的统计学知识了。

但是我觉得对于大部分情况来说,找到原因基本上可以达到目的。
比如你发现访问量提升的原因是之前的宣传到位,那么你可以判断宣传的方案是有效的。
以后有类似的项目也可以这么去做。
而不是“冒失”的将所有的精力耗费在“继续提升首页配色设计”上。


写在最后
有一本书其实和《统计思维》有异曲同工之妙,叫做《用户体验度量》。
只是说《统计思维》应用会更加宽泛,作者强调的不是某一个专业或者领域,而是比较普遍的应用。

小婧是一名行走在实践路上的资深业务分析师(BA),如果想与我同行,就请关注我吧!

你可能感兴趣的:(如何寻找事件背后的原因?)