数据分析失误知多少?

数据分析失误知多少?_第1张图片

数据分析,看似只要简单的进行数字逻辑处理便能得出想要的结果,但在实际运用中往往会遇到一些不可控的问题:

l搜集好相关数据后,却不知该从何处开始分析;

l投入大量的时间成本后,没想到栽在工具使用上,分析的结果不尽人意;

l分析后写出来的数据报告自己都没兴趣读下去......

那我们能怎么办呢?首先应该明确的是,数据分析最终目的,不是数据分析本身,而是其结果能作为硬性指标进而指导最终的应用层决策;然后,在进行数据分析时,善于从多方位审视过程以及结果,尽量减少以下几个方面的失误,会帮助得出更精确的数据分析报告~

1.图表可视化:眼见不一定为“实”

我们都认为,在研究图表后,可视化结果一目了然,然后心怀悟道般的欣慰之情开始狂欢,但往往就是其可视化的轻而易举侮辱了我们的智商!!!

下图是某短视频8月在某个网站和爱奇艺(仅供参考)的运营数据统计比较,以两个柱状图进行分析,但不难发现,虽然视觉上让人震撼,但为了强调增长趋势,Y轴的起点坐标并非为0,,这样容易造成误导,使得忽略了0到100 之间的量的影响。


数据分析失误知多少?_第2张图片

2.依赖绝对值

经常会听到数据分析得出一个结论便是:这个功能的转化率还不错,达到了66%,然后就没有然后了,这样的结论,其实十分苍白无力,我们普通人购物都要货比三家,更何况是这种衡量关键指标的数据呢?使用绝对值推导结果,一定是不符当前市场环境的,最好是找到对比的标杆,来验证分析结果的达标率。

最著名的例子莫过于辛普森事件中的律师辩护。辛普森因涉嫌杀妻而不得已进行辩护,当被指控是因为家暴而进行杀妻,辛普森的律师提出了“家庭虐待导致谋杀的可能性极小”的论点,显示概率为千分之一。

不管辛普森是否杀妻,这个论断确实达到混淆视听的目的。首先,谋杀妻子的概率本来就极低,不虐妻的丈夫谋杀妻子的概率可能远低于千分之一,这就是所谓的“检察官谬论”。其次,拒另外的数据统计显示,长期遭受家庭虐待的妇女被谋杀了,凶手是她家人的概率大于50%。尽管这样,陪审团只是盲目的相信了千分之一这个看起来很低的数据。

3.逻辑不通

一般而言,数据分析的逻辑是:先梳理一件事的目的、流程和逻辑(实际上也就是梳理清楚业务逻辑),界定出关键用户行为和数据,分析数据找到问题,思考解决方案。但在拥有一卡车的数据后,仍旧会出现逻辑推理混乱的情况。

最近身边发生了一个逻辑推理让人无语的真实案例,某个产品发布新功能N,但疑似与另一个已有功能M发生冲突,最糟糕的情况是M的用户流失了,进而转移到N,就是我们常见的因小程序用户增多而使主打APP的数据下滑,而接下来某些负责人的结论却让人瞠目结舌,他经过一天的数据分析后得意宣称:担心多余了,因为数据显示,使用N功能的用户有70%使用了M功能......

画外音:那么使用N而不用M的40%用户在干嘛呢?算不算M功能的流失?

因此,我们需要运用的指导理论是理清思路,严格执行一步步的推导。

4、以偏概全的测试

数据分析过程中,免不了会有一个严肃的步骤——新功能测试,当产品经理利用小规模测试甚至是AB测试来观察新功能时,会发生一个诡异的现象却是,虽然小规模测试效果不错,但全量之后却差强人意。而这往往可能是因为取样偏差造成的。

所以,当实行全量测试时,尽量还原数据的真实性,才能使最终的结果与小规模测试保持高度统一,也能为决策者带来最准确的信息。

5.相关关系和因果关系之间的混乱

在数据分析的逻辑里,若将相关性和因果关系混淆,也会导致成本错误。

最著名的例子是《魔鬼经济学》里的分析,由于因果关系的相关性错误,导致伊利诺斯州给本州的学生发书。一开始,根据分析显示家里有书的学生在学校的成绩表现会更加优异,进一步分析显示,家里有图书馆的学生在学业上会有更好的表现,即使他们从来没有读过这些书。

这改变了之前的假设和洞察:在家里打造图书馆的家庭,能营造愉快的学习环境。

大部分的数据分析在处理大数据时假设相关关系直接影响因果关系,使用大数据来理解两个变量之间的相关性通常是一个很好的实践方法,但总是使用 “因果”类比可能导致虚假的预测和无效的决定。要想实现利用大数据的最好效果,必须理解相关关系和根源的区别。关联往往是指同时观察X和Y的变化,而因果关系意味着X导致Y。在数据科学里,这是两个完全不同的事情,但是许多数据科学家往往忽视了它们的区别。基于相关性的决定可能足以采取行动,我们不需要知道原因,但这还是完全依赖于数据的类型和要解决的问题。

“数据科学中相关关系不是因果关系”。如果两个关系出现彼此相关的情况,也不意味着是一个导致了另一个的产生。

数据分析就是定性分析和定量分析的相互结合、不断验证的过程,因此随着实际操作,总会出现大大小小的问题。但若能保持一腔热血,如同初恋一样去对待数据,便会使服务于企业的数据更加准确。另外,有其他的疑问,也可咨询大神,谁让他们避过的地雷比你发过的牢骚还要多呢~

本文转载自宝原科技。

你可能感兴趣的:(数据分析失误知多少?)