BDA初级考试第二周

DAY1:



 DAY2:

发现机会,提出解决方案

数据隐含的规律和趋势有哪些:

1.事件发生结果的概率是什么?

2.哪些事更重要?

3.事件未来的发展方向是什么?


通过数据隐含的规律和趋势能帮助决策:

1.做大概率会发生的事

2.优先做重要的事

3.顺应趋势做事,提前布局


发现机会提出解决方案的目的是什么?

以业务问题为方向,分析事件发生的规律(常用方法:分布分析),同时结合业务逻辑,形成能够解决业务问题的有效方案。

什么是分布分析:对数据的分布情况进行描述,从而对事件的发生规律有准确的认识。

分布分析按数据类型分为3种:

定量数据:事件发生的一般结果是什么(中心位置)?事件结果的变化情况(分散程度)?事件各个结果的发生概率是什么?(图形特征)

定性数据:哪些对象需要重点关注?

定时数据:事件发生的趋势是什么?事件的发生是否存在周期性?


定量数据的分布分析:

目的:分析事件发生的一般结果,结果的变化情况以及各类结果出现的概率。

分析方法:分散程度(方差、标准差、极差、变异系数(标准差、平均值))、中心位置(均值、中位数、众数、四分位数)、图形特征(看是否符合概率分布)。

分散程度分析步骤举例:

1、选择需要分析的定量数据

2、计算样本的方差

3、根据样本方差结果选择处理方式(EXCEL中用var.P()函数计算)


同一对象不同时间的波动:方差大信息量大,受外界因素影响较大,可通过特征的贡献度分析来寻找影响波动的原因,查看是否存在周期性。方差小信息量小,可以通过时间序列等方法进行预测。

同类对象相同时间的波动:方差大信息量大,各个对象的差异较大,可寻找差异大的原因,差异值中一般蕴藏机会。方差小信息量小,各对象间的差异不大,对象结果的影响不大。

通过检验数据的分布类型,可以预测事件发生概率。


定性数据的分布分析

目的:寻找不同类对象间的区别,或者对不同类别的对象做不同的处理,确定需要重点关注的对象。

定性数据发布分析的方向:

1.占比分析(以某一类定性特征作为分类标准看定量数据的分布情况)

2.累计分布分析(以某一类定性特征作为统计对象看定量数据的累计分布情况)


占比分析步骤:

1、确定需要进行分布分析的定性属性和需要进行计算的定量属性

2、以定性属性划分的类别作为分析对象,对相同对象的数据进行汇总计算

3、计算各分类对象汇总结果的占比情况。


累计分布分析步骤:

1、确定需要进行分布分析的定性属性和需要进行计算的定量属性;

2、按照定量数据从大到小进行排序,并计算定量数据占总和的比值;

3、计算累计占比:第N行的累计占比=前N行的和/总和

4、画出累计分布曲线(找出20%的产品但是产生80%收益的情况)


定时数据的分布分析:

目的:寻找事件发生结果随时间变化的规律,从而对未来的结果形成预测。

定时数据分布分析的方向:

周期性分析(事件的发生是否存在周期性)

时间序列分析(事件的发生趋势是怎么样的)

怎么做周期性分析?--绘图法

怎么做事件序列分析?--趋势拟合、平滑法(直接通过EXCEL的绘图方式)


DAY3:

1、逻辑树分析法:

逻辑树又称问题树、演绎树、分解树等。

逻辑树是将问题的所有子问题分层罗列,从最高层开始逐步向下扩展的过程。

优势:将繁杂的数据工作细分为多个关系密切的部分,不断地分解问题;在纷繁复杂的现象中找出关键点,推动问题的解决。

注意点:需要强逻辑性,上下间的关系是否混乱,确保每一步都可被分析。

2、多维度拆解分析法--从多角度分析问题

多维度拆解法就是维度+拆解,从多个角度思考问题的过程。

可以从哪些维度来拆解问题?

从指标构成拆解:用来记录关键流程的,衡量目标的单位或方法,如DAU、留存率、转化率等。(指标由哪几部分构成)

从业务流程拆解:观察指标的角度,如时间、来源渠道、地理位置、产品版本维度等。(业务流程是什么)

例如:如何制定明年销售KPI?

第一步:指标拆解

第二步:对指标进行多维细分

第三步:根据历史业务发展情况,计算不同用户维度、不同商品维度下的商品营收

第四步:求和不同用户维度、不同商品维度下的商品营收,即为商品总营收。

优势:面面俱到,做到不以偏概全;适合分工快速有效推进;有效锁定问题节点。

注意点:尽可能在条件允许范围内考虑周全;

提前评估时间和人力,避免出现延期等状况。

应用场景:

分析某牌子店铺广告推广效果如何

A产品与B产品相比有什么优势

分析短视频低龄用户留存率较差

3、对比分析法--通过对比分析问题的原因

什么是对比分析:与其他类似的商品进行比较。

需要明确比较对象(和谁比),比较内容(比什么),如何比,比较结果。

在日常的数据分析中,一般选择:

1、比较对象

和自己比

和行业比

2、比较内容

数据整体大小、数据波动程度、趋势变化

3、如何比

数据整体大小

数据整体的波动

趋势变化

对比分析法的定义:

对比分析法指将两个或两个以上的数据进行比较,分析他们的差异,从而揭示这些数据所代表的事物发展变化情况和规律性。

对比分析法的分类:

静态比较(同一时期,不同对象的比较)

动态比较(同一对象,不同时期的比较)

对比分析法实践应用:

与目标对比

与不同时期对比

与同级部门、单位、地区对比

行业内对比

与活动效果比

优势:

具有至关可比性,10%提升到底好不好,50%留存到底好不好。

能找到直接差距,便于做深入分析研究。

注意点:

指标的口径范围、计算方法、计量单位必须一致,即要用同一种单位或者标准去衡量。

对比的对象要有可比性,对比的指标类型必须一致。

应用场景:

分析两种营销活动哪种激励效果更好

分析APP改版前后对用户留存的影响。

分析新用户在不同渠道的支付转化率

DAY4:

4、群组分析--用户留存及流失分析

群组分析也叫同期群分析,也就是对数据分组后对比。(横向分组同一时期进来的用户数,比较每月的留存率;纵向分组:不同时期进入的用户某月的留存率)

优势:

细分用户,破开迷雾(同期群的概念)

横向比较,量化用户留存率的变化趋势

纵向比较,量化改进效果

注意点:

对于有重大异常的群组,需要使用其他方法进行深挖(逻辑树、对比分析等)

对如何界定异常有合理的判定(业务积累,数学判定)

应用场景:

分析APP改版后用户留存情况

分析产品上线后用户充值的情况(每日新进+付费比例)

分析某银行近期整体房贷还款逾期严重问题(新老用户+逾期比例)

5、RFM分析

RFM分析三大流程:

选取正确的指标(R、F、M分别对应什么)

选取合适的评分方式(数据百分比或数值进行评价,例如每20%为1档)

选取适当的分组数量(RFM值相同的分在一组)

优势:

有效控制成本

帮助了解客户的特性

易懂简单好操作

注意点:

结合业务实际情况对对用户进行打分,可能形成截然不同的结果

需要定期刷新结果,不可长期反复使用

应用场景:

广告转化率

6、AARRR模型分析法—用户行为分析

为产品运营制定决策,实现用户增长。

对应产品运营5个重要环节:获取用户—激活用户—提高留存—增加收入—推荐

AARRR模型类似漏斗形

通过产品生命周期的用户迭代思维找到目标用户

获取用户:曝光率、下载量、安装量、DNU、用户获取成本

激发活跃:激活量、DAU/MAU、DNAD

提高留存:次日留存量/日留存量/14日留存率(新进用户的留存)

增加收入:成交量、ARPU/ARPPU、付费率、复购率

推荐:转发率、转化率

K因子的计算公式不算复杂,K = (每个用户向他的朋友们发出的邀请的数量) * (接收到邀请的人转化为新用户的转化率)。假设平均每个用户会向20个朋友发出邀请,而平均的转化率为10%的话,K =20*10%=2。这个结果还算是不错的效果——当K>1时,用户群就会象滚雪球一样增大。如果K<1的话,那么用户群到某个规模时就会停止通过自传播增长。

优势:事无巨细,覆盖业务整体场景

帮助业务会用户有清晰认知,并知晓当前用户存在的隐患

注意点:

体系较为庞大,需清洗每一步的关注点

发现问题需及早暴露并深入分析

应用场景:

分析产品用户生命周期情况

DAY5:

7、漏斗分析--用户转化分析

AARRR是漏斗模型中的一种。

漏斗分析是一套流程式数据分析,它能科学反映用户行为状态以及从起点到终点各阶段用户转化率情况的重要模型。

漏斗分析的特征:

1.分多层次多环节

2.各环节是有转化率(或者流失)效应的

3.环节之间有先后顺序


漏斗分析的计算逻辑:

1.明确时间范围等筛选条件

2.确定漏斗的划分阶段及条件(有业务逻辑支撑的)

3.关于漏斗的类型

4.两个相邻阶段之间的逻辑

5.漏斗的统计


漏斗模型涉及从用户进入的起始到结束的每个环节,每个环节都有转化和流失。

优势:

通过交叉对比,找出数据的差异,定位异常数据

通过细致拆分,把复杂的、多因子的事件分析拆分为独立的、单因子的归因分析

注意点:

需要避免流程上前后顺序无关联或者顺序颠倒

确保每一步效果数据均可被计算

应用场景:

用户注册转化下降分析

分析某电商平台公司用户支付率低的原因

某APP新功能使用率低的原因分析


8、相关性分析--了解事物内在联系

两个变量或多个变量之间相关关系的分析叫相关性分析。

通常用来分析两组或多组数据的变化趋势是否一致。

比如身高和体重是否存在关系。

优势:

先验的事物相关性输入,两者是否有关联

统计意义上较为严谨

注意点:

避免得出结果,A导致B或者B导致A

没有线性相关不代表真的没有相关性

应用场景:

分析突然降温和长袜销量增加是否有关系

分析客户投诉率增加是否和新功能上线有关

分析楼市上涨是否和股市上涨有关


你可能感兴趣的:(BDA初级考试第二周)