数据分析思维:分析方法和业务知识

数据分析思维:分析方法和业务知识

  • 1.业务指标
    • 1.1 数据分类
    • 1.2 常用指标
      • 1.2.1 用户数据指标
      • 1.2.2 行为数据指标
      • 1.2.3 产品数据指标
      • 1.2.4 推广付费指标
    • 1.3 如何选择指标
    • 1.4 指标体系和报表
      • 1.4.1 什么是指标体系
      • 1.4.2 指标体系有什么用
      • 1.4.3 如何建立指标体系
      • 1.4.4 建立指标体系的注意事项
  • 2.分析方法
    • 2.1 5W2H分析方法
    • 2.2 逻辑树分析方法
    • 2.3 行业分析方法
    • 2.4 多维度拆解分析方法
    • 2.5 对比分析法
      • A/B Test
    • 2.6 假设检验分析方法
    • 2.7 相关分析方法
    • 2.8 群组分析方法
    • 2.9 RFM分析方法
    • 2.10 AARRR模型分析法
    • 2.11 漏斗分析方法
  • 3.用数据分析解决问题
    • 3.1 数据分析解决问题的过程
    • 3.2 如何明确问题
    • 3.3 如何分析原因
    • 3.4 如何提出建议

数据分析思维:分析方法和业务知识_第1张图片

1.业务指标

1.1 数据分类

用户数据、行为数据、产品数据

1.2 常用指标

1.2.1 用户数据指标

(1)对于新增用户使用的指标:日新增用户数

(2)对于活跃用户使用的指标:活跃率

日活跃用户数、周活跃用户数、月活跃用户数

(3)对于留存用户使用的指标:留存率

留存可以评估产品功能对用户的黏性

1.2.2 行为数据指标

  • PV(Page View)访问次数

  • UV(Unique Visitor)访问人数

  • 转发率

  • 转化率,如广告转化率=点击广告的人数/看到广告的人数

  • K因子,用来衡量推荐的效果,即—个发起推荐的用户可以带来多少新用户。K因子=平均每个用户向多少人发出邀请×接收到邀请的人转化为新用户的转化率。假设平均每个用户会向20个朋友发出邀请,而平均的转化率为10%的话,K因子=20×10%=2。
    当K>1时,新增用户数就会像滚雪球一样增大。如果K<1的话,那么新增用户数到某个规模时就会停止通过自传播增长。

1.2.3 产品数据指标

  • 用来衡量业务总量的指标:如成交总额、成交数据量

  • 用来衡量人均情况的指标:如客单价

  • 用来衡量付费情况的指标:付费率、复购率

  • 与产品相关的指标,如热销产品数、好评产品数、差评产品数

1.2.4 推广付费指标

(1)展示广告位

(2)搜索广告

(3)信息流广告:

按投放的实际效果付费(CPA,Cost Per Action)包括:
CPD(Cost Per Download):按APP的下载数付费;
CPI(Cost Per Install):按安装APP的数量付费,也就是下载后有多少人安装了App;
CPS(Cost Per Sales):按完成购买的用户数或者销售额来付费

1.3 如何选择指标

(1)好的数据指标应该是比例。要将指标换算成比例。

(2)根据目前的业务重点,找到北极星指标。

要根据目前的业务重点,去寻找北极星指标。

1.4 指标体系和报表

1.4.1 什么是指标体系

一个指标没办法解决复杂的业务问题,这就需要使用多个指标从不同维度来评估业务,也就是使用指标体系。指标体系是从不同维度梳理业务,把指标有系统地组织起来。简而言之,指标体系=指标+体系,所以一个指标不能叫指标体系,几个毫无关系的指标也不能叫指标体系。

1.4.2 指标体系有什么用

  • 监控业务情况
  • 感通过拆解指标寻找当前业务问题
  • 评估业务可改进的地方,找出下一步工作的方向

1.4.3 如何建立指标体系

(1)明确部门KPI(关键绩效指标法),找到一级指标。

一级指标是用来评价公司或部门运营情况最核心的指标

(2)了解业务运营情况,找到二级指标。

有了一级指标以后,可以进一步将一级指标拆解为二级指标。具体如何拆解,要看业务是如何运营的。例如销售部门一般按地区运营,就可以从地区维度拆解。市场部门—般按用户运营,就可以从用户维度拆解。

(3)梳理业务流程,找到三级指标。

把二级指标按照业务流程拆解为更细的三级指标

(4)通过报表监控指标,不断更新指标体系

报表就是报告状况的表,是通过表格、图表来展示指标,从而方便业务部门掌握业务的情况。

制作报表的步骤:需求分析、建立指标体系、设计展现形式、编写需求文档、报表开发。

1.4.4 建立指标体系的注意事项

(1)没有一级指标,抓不住重点。

(2)指标之间没有逻辑关系。

(3)拆解的指标没有业务意义。

(4)一个人就完成了指标体系和报表,也不和业务部门沟通。

2.分析方法

数据分析思维:分析方法和业务知识_第2张图片

2.1 5W2H分析方法

5W是指对于所有的现象都追问5个问题:what(是什么)、when(何时)、where(何地)、why(为什么)、who(是谁)
2H是指再追问2个问题;:how(怎么做)、how much(多少钱)。

5W2H分析方法可以帮助我们解决简单的问题,比如:

  • 如何设计一款产品?

  • 设计一款APP的调查问卷,如何设计问卷上的问题?

5W2H分析方法很好理解,但是在复杂的商业问题面前不起作用。这是因为复杂的商业问题不会只有—个原因,而是由多个原因引起的。

2.2 逻辑树分析方法

逻辑树分析方法是把复杂问题拆解成若干个简单的子问题,然后像树枝那样逐步展开。

2.3 行业分析方法

进行行业分析,就是用PEST分析方法,PEST分析方法是对公司发展宏观环境的分析,所以经常用于行业分析。通常是从政策(Policy)、经济(Economy)、社会(Society)和技术(Technology)这四个方面来分析的。

2.4 多维度拆解分析方法

​ 通过多维度拆解数据,我们发现了和一开始截然相反的结论,这种现象被称为“辛普森悸论”(Simpson’s Paradox),也就是在有些情况下,考察数据整体和考察数据的不同部分,会得到相反的结论。

​ 只看数据整体,我们可能注意不到“数据内部各个部分构成的差异”。所以,我们需要从多个维度去观察数据,并相互验证,才能得出相对可靠的结论。

一般会从指标构成或者业务流程的维度来拆解。
1)从指标构成来拆解

2)从业务流程来拆解

2.5 对比分析法

(1)和谁比

和自己、和行业

(2)如何比较

数据整体的大小:平均值、中位数、或某个业务指标

数据整体的波动:标准差除以平均值得到的值叫作变异系数。变异系数可用来衡量整体数据的波动情况。

趋势变化:趋势变化是从时间维度来看数据随着时间发生的变化。常用的方法是时间折线图、环比(和上一个时间段对比,用于观察短期的数据集)和同比(与去年同一个时间段进行对比,用于观察长期的数据集)。

(3)注意事项

在进行比较的时候,要注意比较对象的规模保持一致。

A/B Test

A/B测试的背后也是用了对比分析方法。什么是A/B测试?

简单来说,A/B测试就是为同一个目标制定两个版本,这两个版本只有某个方面不一样,其他方面保持一致。

2.6 假设检验分析方法

假设检验分析方法分为3步:

(1)提出假设

(2)收集证据

(3)得出结论

假设检验分析方法可以分析问题发生的原因,也叫作归因分析。

如何使用假设检验分析方法?

如何客观地提出假设?
可以从按用户、产品、竞品3个维度提出假设,来检查提出的假设是否有遗漏。

(1)假设用户有问题:可以从用户来源渠道这个维度来拆解分析,或者画出用户使用产品的业务流程图来分析原因
(2)假设产品有问题:可以研究这段时间销售的产品是否符合用户的需求
(3)假设是竞品导致的问题:可以看竞品是不是在搞什么优惠活动,用户跑到竞争对手那里了

我们还可以从4P营销理论出发来提出假设:产品(product)、价格(price)、渠道(place)、促销(promotion)

2.7 相关分析方法

当我们研究两种或者两种以上的数据之间有什么关系的时候,就要用到相关分析。如果两种数据之间有关系,叫作有相关关系。

相关分析的作用:
(1)在研究两种或者两种以上数据之间有什么关系,或者某个事情受到其他因素影响的问题时,可以使用相关分析。

(2)在解决问题的过程中,相关分析可以帮助我们扩大思路,将视野从一种数据扩大到多种数据。

(3)相关分析通俗易懂,方便沟通。

X,Y的相关系数r=X与Y的协方差/根号下(X的方差*Y的方差)

相关系数的范围为[-1,1]

r的绝对值越大,表示相关性越强

r为正代表正相关

相关系数的两个作用:
(1)相关系数的数值大小可以表示两种数据的相关程度,系数值大于0.6或者小于-0.6,表示两种数据之间高度相关;
(2)相关系数数值的正负可以反映两种数据之间的相关方向。

如何判断两种数据之间是相关关系还是因果关系?
要用到“单变量控制法”,也就是控制其他因素不变,只改变其中一个因素,然后观察个因素对实验结果的影响。

例如,每天早上公鸡—打鸣,太阳就会升起,如果我们把公鸡杀掉,太阳还是会升起,完全不受公鸡的影响。所以, “太阳升起”和“公鸡打鸣”是相关关系,而不是因果关系。

2.8 群组分析方法

(1)是什么?

“群组分析方法’’(也叫同期群分析方法)是按某个特征,将数据分为不同的组,然后比较各组的数据,说白了就是对数据分组然后来对比。

(2)有什么用?

群组分析方法常用来分析用户留存率(流失率)随时间发生了哪些变化,然后找出用户留下或者离开的原因。

产品会随着时间发布新的版本,产品改版的效果如何?版本更新后用户是增长了,还是流失了?像这类问题就需要将用户按时间分组,然后比较不同组的用户留存率。

(3)如何用?

​ 先使用群组分析方法,找到留存率低或留存率高的组;然后使用假设检验、相关分析等方法,研究为什么这些组留存率低或留存率高。找到原因以后,就可以对应地优化产品。
​ 当群组分析表格里的数据比较多的时候,直接分析起来比较困难,这时可以把数据绘制成折线图,这样就可以很容易地发现数据发现了哪些变化。

​ 使用群组分析方法需要注意如何分组,除了按时间分组,还可以根据具体的业务场景来确定。

2.9 RFM分析方法

​ RFM是3个指标的缩写:最近1次消费时间间隔(Recency)、消费频率(Frequency)、金额(Monetany),通过这3个指标对用户分类的方法称为RFM分析方法。

  • 各指标特征如下:
    对于最近1次消费时间间隔(R),上—次消费离得越近,也就是R的值越小,用户价值越高。
  • 对于消费频率(F),购买频率越高,也就是F的值越大,用户价值越高。
  • 对于消费金额(M),消费金额越高,也就是M的值越大,用户价值越高。
    数据分析思维:分析方法和业务知识_第3张图片

例如店铺某个月收入大幅下跌,通过分析,发现原来店铺几个重要的用户被竞争对手挖走了,而这几个用户贡献了店铺80%的收入。

通过RFM分析方法可以把用户分为8类,这样就可以对不同用户使用不同的营销策略,例如信用卡的会员服务。

不同业务中R、F、M的定义不同,要根据具体业务灵活应用。
R、F、M按价值确定打分的规则—般分为1~5分,也可以根据具体业务灵活调整。

2.10 AARRR模型分析法

AARRR模型对应产品运营的5个重要环节,分别是:
获取用户(Acquisition):用户如何找到我们?
激活用户(Activation):用户的首次体验如何?
提高留存(Retention):用户会回来吗?
增加收入(Revenue):如何赚到更多钱?
推荐(Referral): 用户会告诉其他人吗?

​ 因为AARRR模型涉及用户使用产品的整个流程’所以它可以帮助分析用户行为,为产品运营制定决策,从而实现用户增长。例如,使用其他分析方法定位到问题的原因是留存率低,那么就可以参考AARRR模型里留存这一环节的策略来提高留存率。

2.11 漏斗分析方法

​ 从业务流程起点开始到最后目标完成的每个环节都会有用户流失,因此需要一种分析方法来衡量业务流程每一步的转化效率,漏斗分析方法就是这样的分析方法。

​ 漏斗分析的作用是“定位问题节点”,即找到出问题的业务环节在哪。漏斗分析常用于用户转化分析或者用户流失分析,所以漏斗分析中要关注两个指标:用户转化率和用户流失率。
经过各个业务环节转化下来的用户,会产生更大的价值。因为这部分用户更加忠诚,更认可业务的流程。随着转化用户的不断增加,留存用户的规模也在不断增大,产品的盈利规模也会随之增加。
​ 流失的用户数量在每个业务环节都不同。可以分析用户主要流失在哪个业务环节,以及为什么流失,是因为业务流程过于复杂,还是产品特性无法完全展现,或是其他原因,最终的目的都是不断减少用户流失率。

3.用数据分析解决问题

3.1 数据分析解决问题的过程

(1)明确问题

(2)分析原因

(3)提出建议

3.2 如何明确问题

(1)明确数据来源和准确性

  • 时间
  • 地点
  • 数据来源

(2)业务指标理解

对于业务指标,可以分析指标含义、和谁比。

3.3 如何分析原因

如何知道哪些是“关键的因素”呢?可以在分析的过程中使用这3步来分析:
(1)使用“多维度拆解分析方法”对问题进行拆解,将一个复杂问题细化成各个子问题

(2)对拆解的每个部分,使用“假设检验分析方法”找到哪里出了问题。分析的过程可以用“对比分析方法’’等多个分析方法来辅助完成
(3)在找到哪里出了问题以后,可以多问自己“为什么出现了这个问题”,然后使用“相关分析方法’’进行深入分析。

3.4 如何提出建议

在提出建议这一步,常用的分析方法是回归分析或者AARRR模型
分析方法。

要注意的是:
(1)做决策的选项不能太多。太多的选项不仅会增加决策的成本,还会让人迷失,无从下手。相对简单的问题,需要4个选项左右;相对复杂的问题,需要4~7个选项
(2)决策要是可以落地的具体措施,这样决策者才能根据措施,合理安排资源,把措施变成行动

你可能感兴趣的:(Python数据分析,数据分析)