前面几讲,我们从数据岗的知识体系出发,学习了常用的SQL语法,复习了统计学的基础知识。今天的分享我们是数据分析岗的最后一讲,着重于分享常用的统计学指标以及数据分析师的常用分析方法。
「
Part 1
常用的统计学指标
」
数据集合包括无序数据集、有序数据集两种类型,对于不同类型的数据集,对应着不同类型的统计指标,下表小编为大家整理了不同类型数据对应的统计指标以及EXCEL函数和SQL函数。
「
Part 2
基础数据分析
」
一、对比分析
二、结构分析
不同的构成成分又不一样的增长速度、成本、管理难易程度,分析业务构成有利于抓住重点、差异化运营、达成KPI目标。
同一事物可以从多个角度分析结构,需要根据分析目标选择合适的结构拆分维度
需要多层下钻的时候,拆分先后顺序很重要
结构分析不止看结构,也要看关心的指标在拆分后的表现。
三、同期群分析
同期群分析(Cohort Analysis,亦称群组分析的主要目的是分析相似群体随时间的变化(比如用户的回访)。
时期、群体交叉,得到同期群分析,如各年的新客,在后续各年的小手工线,可以用于预测后续年份的销售趋势。
一张图告诉你,什么是同期群分析。
所谓同期群分析,也就是将用户按初始行为的发生时间进行划分为群组(即同期群),然后:
1. 对处于相同生命周期阶段的用户进行垂直分析(横向比较),从而比较得出相似群体随时间的变化(图中例子表明:从初始行为开始,留存的用户在逐渐降低)。
2. 通过比较不同的同期群,可以从总体上看到,应用的表现是否越来越好了。从而验证产品改进是否取得了效果。
用户留存分析是将用户的留存行为分为:
初始行为:如“首次使用App”、“成功注册”或“第一次产生购买行为”等;
留存行为:可以是用户的任何行为,如产生购买、使用App、分享等;
通过将用户按初始行为的发生时间分组(得到同期群),然后再统计初始行为时间后不同时段内留存行为的发生频次(或其他有意义的计量,比如消费金额)。
四、漏斗分析、路径分析
漏斗,简单来讲,就是抽象网站或APP中的某个流程,观察流程中每一步的转化与流失。对目标的过程要素进行定义,包括阶段划分、阶段升迁标志、阶段升迁率、平均阶段耗时、阶段任务等,形成目标路径,分析升迁路径各阶段的机会和障碍,优化产品,促进目标达成。常见于流量产品分析。
漏斗的三元素
根据漏斗的定义,我们可以抽象出漏斗的三元素:
时间
节点
流量
时间
这里的时间,特指漏斗的转化周期,即为完成每一层漏斗所需时间的集合。通常来讲,一个漏斗的转化周期越短越好,尤其是在某些转化周期较长的行业,比如:在线教育行业,B2B电商行业。
此外,单独查看每一层漏斗的时间,也能发现一些问题。举例来说,如果发现从某个渠道导入的流量,在某层漏斗的消耗时间惊人的一致,这说明该渠道的流量很可能有异常。
节点
每一层漏斗,就是一个节点。而对于节点来说,最核心的指标就是转化率,公式如下:
转化率 = 通过该层的流量/到达该层的流量
整个漏斗的转化率以及每一层的转化率,可以帮助我们明确优化的方向:找到转化率低的节点,想办法提升它。
流量
流量,也就是人群。不同人群在同一个漏斗下的表现情况一定是不一样的,比如淘宝的购物漏斗,男人和女人的转化率不一样,年轻人和老人的转化率也不一样。
通过人群分类,我们可以快速查看特定人群的转化率,更能清晰定位问题。
例如,一家电商网站,从浏览宝贝详情到付款的转化率仅有3.6%。通过创建购买流程的漏斗,分析购买的转化率过低的原因。
五、聚类分析
聚类分析是根据事物的特征进行归类,以便根据特征去做管理、决策。目的是提升效率、降低成本。换句话说就是将很小的单位聚成几类,所关注的对象量级减少。
前提:特征是用于业务。
人群的特征千千万,单业务也有自己的形态,例如线下的业务不适合用消费者线上行为作为聚类特征。
六、相关分析
相关性是指两个或多个变量之间,它们的波动变化具有一定的一致性。通过这种波动一致性的分析,可以研究变量之间的关联,相关性是最简单的二元组。
有相关性并不代表有因果关系,相关性需要柱以及核问题:相关性大小、在什么范围相关、可以揭示的相关性。
「
part 3
参考链接
」
[1][及策云课堂]的《数据分析卡片(三):漏斗分析》,http://www.woshipm.com/data-analysis/758063.html
[2] 简书[陈正曦]的《同期群分析》,https://www.jianshu.com/p/145a13355fa1