数据分析这几个坑,切勿越陷越深

数据具有客观性,能呈现令人信服的信息依据,所以探寻数据、挖掘规律成为了寻找所需信息的最有利手段之一。

但数据也并非万能,有时候会传递错误的信息。在梳理数据分析流程和数据打交道的过程中,“聪明的数据分析师”经常会犯一些错误,导致分析结论于实际经验呈现较大的偏差。

因此,这里总结了数据分析过程中的几个深坑,以告诫大家警惕这几个误区。

坑1:样本容量差异导致结论偏差

某年篮球比赛,A球员的三分投篮命中率为42%,B球员的三分投篮命中率为28%,那么能否说明A球员的三分投篮命中率要比B球员高?

我们分析了数据的来源,发现那年比赛,A球员所在团队只打了10场球,投了28个三分球;B球员所在团队打了19场球,投了57个三分球。

因此,两者对比的样本容量不同,样本环境不同,单从这一数据来做评价,有失偏颇。

所以在选取样本对照时,要保证其它变量一致,提高结论分析的科学性。

数据分析这几个坑,切勿越陷越深_第1张图片

2、逻辑混乱,不知因果关系

有同学会笑话,这样简单的逻辑也会搞错,没错,就是这样。

最简单的电商,比如你认为商品评论数和销售量成正相关的关系,即一个商品的评论数量越多,那商品的销售额也会越高;或者相反,一个商品的销售量越多,评论数也会越高,两者是相辅相成的关系。

假如你认定前者,数据分析的结论就会指导我们用一些手段来创造更多的商品评论,以此带动商品销量。

但事实上,并不是所有的商品销量都和评论有很大关联,正向思考一下,商品的销量和价格、质量、活动、广告、页面等等诸多因素有关,每个因素都占据一定权重,销量低应该从不足的地方补上。

因此,在分析前应后果时,要明确目的和逻辑关系,以免混乱。

3、数据表达不科学被蒙蔽

数据分析这几个坑,切勿越陷越深_第2张图片

从以上图表来看,似乎第二幅图的结果更喜人,整体均衡向上,左边的数据差异就比较大。

但事实上,两个图表的数据都一样,只是改变了纵坐标值轴的范围,却改变了人的视觉印象。

因此,在做数据分析时,我们需要警惕一些数据处理的小伎俩,不要被数据的视觉效果所蒙蔽。同时在做这类数据分析时,值轴的选取要合理科学,按标准来。

4、唯“数据”论

经常会有人义正言辞地将“用数据说话”,这在有些场景是合理的,但如果过度依赖数据,一方面会做很多没有价值的数据分析;另一方面,也会限制对业务本身的实际思考。

数据分析,仍以“业务”为主,业务的分析一方面来源经验的判断,另一方面依靠数据的辅助分析。很多优秀甚至伟大的产品决策,并非通过数据发现。

很多企业会将数据分析技术交由信息IT部门,而需求者却是业务人员,两者沟通不畅相互脱节会造成很多问题。所以不管是业务人员通过FineBI这一类BI工具的使用,来自助进行分析,参考数据结果来做分析;或是业务人员参与日常报表和数据可视化的开发,都是解决这一类问题的有效途径。

数据分析这几个坑,切勿越陷越深_第3张图片

你可能感兴趣的:(数据分析这几个坑,切勿越陷越深)