数据分析避坑指南-分析思路篇

来源:网易有数    作者:九条

作为分析师,需要对数据和结论负责,所以一定要“大胆猜测、小心求证”。如何小心求证呢?笔者看到、也经历过一些“踩坑血泪史”,下面就从定位问题、分析思路的角度,跟大家分享下。

1

定位问题

场景1:

首先还是老套路,给大家一个选择题:

一个业务同学急急忙忙的找到你,说活动页面的跳出率数据异常,大家觉得第一步应该做什么?

A.反问活动页是否有调整 

B.查下数据任务是否异常 

C.明确“跳出率”口径

--------------10秒钟思考--------------

这是比较常见的场景,为了“确定问题”,我们首先需要明确指标的口径,尤其是有分子、分母的指标,更要清晰分子、分母的定义,否则容易导致“定义谬论”,所以答案是C。

这是笔者遇到过的真实案例,当时业务看到的“跳出率”,是“APP跳出率”,即【跳出APP的人数/页面访问人数】,但对于活动页面的场景,更常规关注的指标是“页面跳出率”,即【页面无点击行为人数/页面访问人数】。所以如果一开始指标的定义就没搞清楚,就开始启动探查和分析,很容易导致南辕北辙。

场景2:

刚才这道题是不是很简单?现在给大家上点难度。

又是这个业务同学,跟你哭诉:累死累活做了个活动,但是“访问支付率”(PS:支付用户数/访问用户数)竟然还下降了(如下表,非真实数据)。

94439f067f2c4bd0abfd3b74026c2bae.png

这时候你会?

A.一起抱头痛哭 

B.鼓励他继续努力

C.可能是辛普森悖论,还需探查

选A的朋友,请控制情绪;选B的朋友,请冷静下来先思考下。

这个场景,其实是比较典型的辛普森悖论,是否可以根据整体指标的下降、就断定活动效果不好呢?

还得按照目标人群去拆分观察,比如按活跃度拆分(非真实数据):

数据分析避坑指南-分析思路篇_第1张图片

神奇了是不是,每类用户群的指标都是上涨的了!

这就是辛普森悖论,即分组都较优的情况下、整体却反而会变差,主要原因是分组的占比相差大,占比低、表现弱势的用户群,随着占比提升、会影响整体的表现。

针对这个问题本身,其实本质情况是沉默用户、新用户占比升高,这个就可以结合活动的策略及目标,判断是否是问题,再进行分析。

场景3:

还是这个业务同学(他的问题有点多hhh),某天突然找到你,神神秘秘地说自己有个大发现:

花卖得越多,店铺的刮胡刀、按摩椅就卖得越多,没想到卖花还能有这作用!自己准备再多卖些花。

这是“相关因果谬论”,误把相关当因果,花和刮胡刀、按摩椅都卖得好,可能是跟父亲节、端午节等节日有关,而不是卖花能导致刮胡刀、按摩椅卖得好。

因此分析师需要深入了解业务,才能探查现象背后的本质,避免发生相关因果谬论类的尴尬。

2

分析思路

以上是在判断问题时,几种较常见的坑,而对于分析师来说,还有一种更常见的坑,叫“乱七八糟胡乱分析”坑。

之前的文章有介绍过矩阵分析、杜邦分析、交叉分析等方法,而一些分析同学在具体实践时,很容易狂堆各种维度,什么用户画像、商品画像、场景画像,噼里啪啦一堆取数,各种盲目地交叉分析,最后整了个几百M的Excel,但是啥有价值的结论也没探查出,然后开始怀疑人生......

那有哪些方法可以帮助我们梳理思路,或者说明确分析框架呢?常用的思路有以下几种:

1、业务流程驱动:业务流程既是了解业务的基础,也是常用的分析框架,需要清楚“结果”是由哪些“环节”导致的,且明晰各“环节”可能与结果相关的因素,就容易探查出相对本质的原因。

例:某商品发生缺货,可以梳理出商品供应的关键节点,评估各个节点上可能的原因,再通过数据去论证。如缺货可能是在做销量预测时即偏低,也可能是下单环节为了控制库转、保守备货,只有梳理清楚相关节点及影响因素,才更容易得到有价值的结论。

数据分析避坑指南-分析思路篇_第2张图片

2、部门职能导向:数据分析是为了明确问题,且定位到具体执行的人或部门,这样才容易推动落地。因此在梳理分析框架时,可按照部门职能,分模块进行分析。

例:活动分析场景,活动分析的维度众多,复盘活动效果最常用的思路之一,就是按活动的负责部门去分类,定位每个部门的好坏、给出相关策略建议,如下图(非真实数据):

数据分析避坑指南-分析思路篇_第3张图片

3、策略目标导向:在做业务分析、尤其是复盘时,分析师经常会遇到无法“判断好坏”,或无法找到分析切入点的情况。很多情况还是归因于“不够了解业务”,既然做分析复盘,还是需要明确业务当时的目标是什么、有哪些策略、策略的方向和目标是什么,以此为基准、确定分析方向,会更加符合客观情况,也更容易与业务达成一致。

例:如下图针对促销活动的分析(非真实数据),可与业务梳理和明确活动目标、策略情况,形成自己的分析复盘的框架:

数据分析避坑指南-分析思路篇_第4张图片

3

小结

这次跟大家介绍了在【定位问题】和【确定分析思路】时,常见的坑及解决方法,也希望大家遇到类似的场景时,会多些谨慎、多些思路。

数据分析路漫漫,大家在做分析时有遇到什么坑吗?欢迎分享。

成都CDA数据分析师

定期分享

数据分析的干货和岗位内推机会

数据分析避坑指南-分析思路篇_第5张图片

你可能感兴趣的:(大数据,数据分析,人工智能,机器学习,面试)