学生时代我曾经是个数学渣渣,渣到什么样程度呢?印象中从高二开始学立体几何起,数学就没有及格过了,高考数学也不例外,在没有及格的情况下总分过了一本念了所重点大学,可见数学拖了多少后腿。
所以我对数学、数字总归是心有戚戚焉的。工作之后接到老板分给我独立承担的第一项工作,竟然是数据分析,数据量还是全部门的,你们可以想象当时我听闻差点都要昏厥过去。
但工作几年下来,我被人夸很多次的也竟然是数据分析,不仅有同事,也有老板。所以渐渐地,我心里竟然树立起了对数据分析方面的安全感,相信这件事我是能够做好的。
我不知道如果凭现在训练过的思维再去学高中数学,我是不是还是会学得很差劲,但总归这件事证明了两点:
数学学得不好,数据分析也可以做的好。
坚持学习和训练,不擅长的事情或许有一天也会不在话下。
前段时间工作上有不少和数据分析相关的事情,这些事联系在一起构成了我一直很想写、占据我的素材库之首快两年却一直觉得还不到时候的题目:如何看数据?
◢◤
工作中免不了看各种数据,从销售、市场职位,到产品经理,都试图从各种繁杂数据中看出点门道,获得对市场、产品、消费者、生意方面的洞见,所谓insight。
这篇文章的前提是假设我们已经跨过了数据获得的技术壁垒,通过公司系统或是不同部门已经获得了很多原始数据,那接下来要如何看?
我总结了5条“要和不要”,附加一些简单的案例作为参考。
1.知道看什么指标,不要迷失于数据的海洋。
我们公司以数据繁多著称,公司各个数据库、系统、不同团队出的报表,只有你没听过没有你想象不到的数据,多到有不少次有人玩笑式地抱怨说跳来这家公司因为天天看表视力都下降了不少。
在这个大数据时代,没有数据不是最糟糕的,有数据却不知道看哪些是最可怕的。如果没有清晰的目的,什么数据都试图去看去掌握,最后很有可能的是什么也看不出来什么也记不住。
所以在看数据之前最重要的一点就是记住你的目标是什么,是分析某个数值变差的原因,还是希望看一段时期内的发展趋势,或者是关注一些异常的点借以深度挖掘。
2. 做信息收集,有一个简单预判再动手,不是漫无目的。
这一点接上一点,在有了清晰的目标之后,还需要收集信息,心里有一个简单的假设和预判,再去找对应的指标看。
还记得我曾经写过的解决问题的分析方法吗?问题的产生是因为有了“偏差”,定义这种偏差,通过比较分析问题,收集信息,产生了一些假设,再顺藤摸瓜寻找答案。
拿之前举过的一个例子,假设老板说:小王,上个月某个品牌销售情况不好。小王在数据分析之前,先做了一些基本信息的收集,了解了5个W (What, When, Where, Who, Why)之后,发现从公司内部角度来看没有出现异常。(详戳:【148】解决问题之第二步:分析问题)
那会不会是外部原因导致了变化呢?比如市场新进入竞争者或者是市场需求下降。带着这种假设,就可以把数据分析重点放在分析外部原因上。
如果没有信息收集和预判,就会陷入眉毛胡子一把抓的情况,把所有相关不相关的数据都抓过来看。
3. 看数据之间的联系,不是表面的数字。
有段时间我和米粒小朋友说多看看数据,米粒问了一个问题:“假如就算是我记住了这些数字,比如这个市场份额我们占多少,那能有什么用呢?”
我回答米粒:“表面的数字是变化的,内在的逻辑是不变的。要设法看到数据之间的联系。”
假设有家公司某个产品的市场份额是25%,用户数占了整个市场的15%。25%也好,15%也好,这些数字都是动态变化的,你就算牢牢记住了当下的,市场变化这么快,下个月说不定全变了。
所以需要把数据和数据对照交叉着看,还是刚才的例子,市场份额和用户数这两个因素对照着看你能得到什么?15%的用户却撬动了25%的市场份额,说明用户消费能力强,高端用户多,还有可能说明用户忠诚度较高,CRM(Customer Relationship Management,客户关系管理)做得不错,也许是因为公司的产品有护城河有特殊功能或者是附加值,也有可能是因为公司的产品就是针对这部分用户开发的所以比较精准,还有可能是针对这部分用户的营销投放很精准。
仅仅看两个数字之间的联系,能解读出的东西太多了。所以那么多数据放在一起对照着看,可以得出很多结论,结论和结论之间再根据这么多不同的假设一个个加强推论或者是互相矛盾推翻假设,从而得到更加扎实信服的结论。
4.看数据背后的趋势和意义,不追求精确。
这一点和上一点类似,在做数据分析的时候,很多时候目的仅仅是看数据背后的趋势和意义,这种情况下不必非要追求数据上的精准性。
有刚工作的小朋友有时候会比较在意数据是否精准,担心掺杂了一些“不够纯”的数据。
我和小朋友解释,不要试图得到完美的数据。如果只是要解读数据背后的趋势和意义,哪怕混了一些无效数据比如5%,只要一组数据之间选取的维度都是相同的,其实就有了内在的相对稳定和一致性。如果不放心可以把单独列个注释说明。
因为一些特殊情况可能占比极小,可以忽略不计。但有时候要剔除那5%的不完美因素,有可能要花之前大于95%的精力去获取数据,如果不是必要,这种情况非常不划算。数据背后的趋势和意义不太会因为这一点不同就颠覆了整个结论。
5. 对比思维,找到参考坐标,不孤立去看。
这条对比思维是我印象很深的一个点。我曾经接触过一个分析工具,当时我自己研究了半天,虽然觉得很有用,但是不知道得出的数据和结论能帮我做些什么,于是就放在一边了。
之后很久的有一次公司内部分享上,有别的部门同事用了同一个工具,选取了国外一个国家的数据,作为参考系,解读出了一些我们地区可以提升的方面。
这种数据的对比思维,如电光火石般击中了我。我只看到了这个分析工具获得的数据内部之间的联系,却没有选取一个参考系,所以得到的结论是有限的。
所以有时候看到联系是不够的,还需要跳出来,在更大的一个范围,更高的层面去对比数据。
◢◤
关于数据分析我最喜欢的例子是一次讲座中,一位前Facebook工程师分享的:
Facebook当年推出“你可能认识的人”功能之后,用户量和用户黏性产生了巨大的变化。这个功能的出发点是什么呢?
是在观察一堆数据的时候他们注意到:当用户的好友数达到一个值的时候,用户花在Facebook上的时间要比那些好友数少的人长。所以接下来的问题是“如何让用户增加好友数?”,于是就有了这个功能推荐你所可能认识的人,鼓励用户添加好友。
所以某种程度上来说,数据分析改没改变世界我不知道,但它起码改变了Facebook。