数据分析的思路与框架

数据分析是产品、市场、运营等岗位的基本技能,越来越多的JD中,将数据分析视作基本要求。当然,大部分情况下,业务需要的数据分析是非常基础的,只需用Excel做基本的统计计算,无须像专业的数据分析师,手握SQL和R,运用回归、分类树等算法,输出高精尖的报告。

从业务场景出发,数据分析是问题驱动的。也就是说,每一次启动数据分析,本质是发现问题、归因问题和解决问题。

基于数据,发现问题是数据分析的第一步。问题之所以被称为问题,是因为数据表现不符合“常理”或逻辑,正所谓“事出反常必有妖”。

我记得大学时上普通心理学课程,讲到精神障碍一章定义“正常行为”时,老师课上讨论过“正常”的定义——是取平均值,还是取众数,还是取中位数?

数据分析中也是如此,“常”是什么?

“常”可以是时序中的历史数据,比如App的日活用户数(DAU),我们要判断它是否正常,通常需要参考T-1、T-7、T-30的DAU,计算环比增幅(降幅)。

“常”也可以是竞品或者行业均值的指标表现。例如,微信公众号头条文章的粉丝打开率为5%(一个虚拟的数字不具备实际参考意义,即100个公众号粉丝,平均5个会打开公众号推送的头条文章)。如果你的公众号的粉丝打开率低于这个数值,那么就要反思,是否是头条文章的内容不够吸引人。

或许你也发现了,“正常”也好,“异常”也罢,都是基于比较产生的。增速“快”、渗透率“高”、客户数“少”,都是相对而言的。因此,基于数据定位问题的第一步,在于找到正确的锚点。

再看一个简单的例子,你就会明白选择正确的“锚点”对于定义问题是多么的至关重要,只有这样才能发现真问题。

互联网广告有一个显著的特点,广告主特别是中小广告主倾向在周末减投或者停止投放,因此周末大盘的广告主数量都会比较少。因此,如果是将周六在投的广告主数量与T-1(昨天,也就是周五)的投放广告主数量想比,在部分行业会出现“断崖式”的下跌。但是如果你去对比T-7(也就是上一个周六)在投广告主数量,你会发现数据并没有发生显著变化。

假设我们已经定义清楚了问题,那么接下来就是找到引起问题的因素,而这则是数据指标按维度的拆解。

维度与指标是大家经常用到,但是也经常容易混淆的两个名词。指标,是对事物本身的衡量,维度是表述事情的角度,是事情的特征。例如2019年中国的新增人口数量,人口数量是一个指标;按新增人口所在的省份拆解人口数量,省份就成为一个维度。一般而言,指标在维度上是可以拆解的。

我们一般依赖指标的“异常”来定义问题,然后通过维度来定位和归因问题。

还是以广告收入为例。广告收入就是一个指标,某天当发现昨日广告收入跌了10亿(日环比、周环比都在下降),接下来就是看,收入在哪个维度上跌了。

最常见的,我们可以按照行业拆解。假设我们有20个一级行业,每个广告主都会被归到一个行业中,通过对每个行业广告收入的日环比和差值绝对值,明确哪个行业应该为广告收入下降“负责”。

例如,我们发现是电商行业的广告收入从前天的10个亿降低到了昨天的1个亿,下降9亿元,占据整体下降的90%(9亿/10亿),我们可以认为是电商行业的下降导致了整体广告收入的下降。

如果我们将分析视角进一步细化,可以聚焦到某几个广告主身上,通常是头部大广告主的减投影响最大。

到了这里,只是走完了问题归因的一半——只是明确了问题在哪。接下来就做的是,就是明确为什么这个行业大广告主减投——直接找到客户问是最直接的。

客户可能回答:双11刚过,市场预算缩减了。

当我们发现了问题,也知道问题出在哪了,接下来就是怎么做,让数据指标恢复到“正常”——由上面的成因,导出你的执行策略。业务场景不同,问题不同,解决问题的方法也就不同,这里也就不展开细讲。

之后的一篇中,我将会围绕维度和指标、问题转译等话题,继续今天的分析。

你可能感兴趣的:(数据分析的思路与框架)