数据分析指标体系的构建

指标体系是什么?

        (S1)为了用量化方式准确描述场景,提出一系列的指标。(S2)将指标有系统地组织起来,形成的逻辑体系

        指标体系 = 指标 + 体系
        单独的几个指标不能称之为指标体系

如何评价指标体系?

如何判断这个指标体系好坏,如何评价指标体系?

        (1)目的清晰 : 指标体系围绕一定的目的 展开分析
        (2)评价全面 : 能够全面描述业务运行情况

        (3)指标简约 : 要从复杂的指标中,选择重要有代表性的指标

指标分级

数据分析指标体系的构建_第1张图片

即使很少的单项指标,相互组合也会衍生出大量的指标。

                比如用户总数和操作时间一结合就是用户操作时间分布。用操作时间统计一年24个小时中,每个小时操作的用户的数量,除以用户总数,就是每个小时用户活跃的比重。后面三个也是类似可以组合出来。

                说这一点是告诉你,当你不知道从哪些角度分析的时候,可以尝试暴力组合,说不定能攒出来不错的指标。

数据分析指标体系的构建_第2张图片

(1)AARRR法

这是一种以用户为中心的分析方法

数据分析指标体系的构建_第3张图片

两种解释:
1.用户与app接触的不同阶段

        用户一开始进来叫新增Acquisition,后来用久了 习惯了 一天不用浑身难受叫Actication激活,后来腻了不想用了就Retention留存.,.

2.不同App也处于不同的运营阶段

        有的App刚刚崛起,比如Meta的新社交平台Thread,还在用户快速新增的阶段,就是处于Acquisition新增阶段。而微信这个在中国人手一个的app就处于Revenue转化为利润的变现阶段。

        两个app应该使用不同的评价指标。

(2)对象法

(S1)从业务中提炼出对象

淘宝的店铺  ,   消费者,   商品

(S2)列出这个对象的 属性  和  动作 。

淘宝的消费者

        属性:注册时间,登录地,手机号,性别,年龄

        动作:点击商品,购买商品,查看订单

有了这样 的思路就可以看购买同一个商品的人的年龄的分布、性别的分布。这样思路就打开了,你就有东西可以分析了,不至于没什么可聊的

对象的 动作  往往就是在不同的对象之间的  连线。 这个连线往往在  连线的两端  形成2个指标。

        比如用户和商品是电商场景中的两个对象。

        商品和用户的连线,就是用户点击了这个商品  这个动作。这个动作是用户 的动作,不是商品的动作。

        这条连线的两端形成了两个指标:(1)多少个用户点击了这个商品(2)这个用户点击了多少个商品

        前一个指标可以用于构建商品的热榜,后一个指标可以用于为这个用户提供精准的推荐

(3)模块法-不同业务线

App往往分为很多业务线,在分析时候,应该分情况构建不同业务线的指标体系

比如百度旗下有:百度搜索、百度文库、百度地图、百度百科、百度知道、百度贴吧、百度网盘....,每个业务线应该构建自己产品线的业务指标

因为不同业务线的用户是不同的群体

(4)过程法 

按照用户操作的 每个行为的先后顺序构建指标体系,注意环节之间的转化率和每个环节的停留时间

        比如像抖音、汽水音乐、以及一些买了推流广告的游戏,他们的指标体系构建可以参考这些流程:曝光——点击——下载——注册——登录——付费

        从这一个环节到下一个环节的转化率是你要格外关注的,因为整个过程是一环套一环的,如果前面有某一个环节的转化率特别低(比如下载这一步,下载的链接的服务器坏了,使得从下载到注册这一环节的转换率很低,导致最后转化得来的付费用户就很少 ),那么后面会因为这一步转化率低,后面做的转化率再高,最红转化为付费实际数量也会不太高。

综合四种方法使用

先用对象法,将业务中的每个  个体进行区分出来

接着从用户的角度用AARRR对用户进行分析

对具体功能上分业务线对用模块法进行分析

常见的指标

新增    

活跃    

热度
时长与次数    

留存率    

转化
内容产品数据    

渠道数据    

设备数据

新增

什么算是“新增”?如何定义“新增”?

1)注册与否:之前没有注册过,当天新注册的用户

2)没登录的情况下,仍然在使用的用户。

关于跟踪点:

        首次有打开,一般不算做“新增”。什么都没操作,可能是误操作打开的,不能算是新增用户。

        首次有:“关键行为”,才算作“新增”

区分“平台新增”和“APP新增”

        很多大公司如阿里和百度,同一个平台下面有多个子公司如飞猪、淘宝、高德、优酷、支付宝 用手机号注册一个账户,这个账户整个平台的所有子公司都通用,被称为平台新增。第一次来阿里这个平台注册账户

        APP新增是指的,在有平台账户的前提下,第一次用飞猪、第一次用高德,这种。

活跃

定义:一段时间内用户有操作的用户数。这里的操作指的是“点击行为”和“购买行为”

热度

        PV

页面被访问的次数

        UV

页面被访问的人数

包括两部分:

        (1)登录的人数,用uid就可以统计

        (2)非登陆的访问人数,通过没登录的这个人访问的ip地址进行粗略统计

        VV

Video View用户看视频的时长

        短视频平台:抖音,平均每个用户的观看时长

        长视频平台:优酷,视频完播率

时长与次数

对于内容类平台(抖音、快手、小红书、知乎、b站、微信读书)来说,他们是格外看重时长和次数

单次访问时长

        定义:总时长/总的点击量

人均访问时长

        定义:总时长/总的访问人数=总时长/UV

        对于内容平台来说,他们希望“人均访问时长”越高越好,最好你一直赖在我的平台上,好有机会转化成付费或者出售广告

        对于电商平台,他希望你在  每个商品的购买页 停留时长越短越好。因为希望购买页的信息能刺激你(1)冲动消费(2)同样时长的浏览,可以激发你购买更多的商品

人均访问次数

        定义:PV/UV=访问次数/访问人数

        对于电商平台,如果 某一个商品  的详情页  的“人均访问次数”   非常高,这是个不好的事情,要么(1)说明你的商品介绍写的让人有困惑,看了好几次都犹豫不决是否下单,要么(2)你的商品定价有点高,顾客在对比你这个商品和其他商品每个维度的参数,犹豫选哪个好

内容跳出率

        定义:点击页面后离开的人数/总点击人数

        两种可能性(1)点开这个引导界面,没有进一步使用、购买、注册、下载,拉新失败;(2)新手引导做的不好,用户不知道怎么使用,于是离开了

留存率

        用于评估有没有回头客

        次日留存率:第一天活跃且第二天还活跃的UV(人数)  / 第一天活跃的UV

        第7日留存率:第1天活跃且第7天还活跃的UV  /  第1天活跃的UV

        第30日留存率: 第1天活跃且第30天还活跃的UV  /   第1天活跃的UV

        什么情境下关注留存率?

                产品更新,大版本上线(比如python2.7到python3.4之间这个升级就是大版本上线),需要评估重点功能升级的优劣的时候

留存率与活跃的不同

        活跃率就是统计每一天每个用户的活跃程度,活跃率没有那种跟踪一批用户的意思

        而留存率是  从这些用户注册开始跟踪他们的活跃程度。留存率也可以说是锚定一批在某一时间段内注册的用户,跟踪他们后面的活跃程度。

        留存率,跟踪哪些用户?

                从某个渠道买来的用户

                某一个日期拉来的用户(比如春晚,除夕那一天,百度发红包拉来的  新用户  是否留存了?)

                通过某一个活动拉来的用户(双十一降价大酬宾,为李佳琦和小杨哥直播间拉来了多少新用户,后面留存了多少有一只在直播间买东西)

        留存率,跟踪用户的哪些行为呢?

                活跃

                付费

                分享

转化

        被动转化

        出售广告

        出售信息

        主动转化

付费原因分析,商品订单达成分析:

        购商品的占比是多少,购买会员的占比是多少

        当日订单状态分布,下单付款 的比重是多少、下单前一刻取消支付的是多少、续费、退货..

付费方式

        全款还是分期,还是信用卡

        购买会员是否选择连续包月

付费渠道

        服务质量

        付费成功率

用户是否是高价值

        付费前1%的,被称为大R。这个用户是不是大R?  把这部分用户伺候好,将是非常重要的,会给他们分配专属客服。

        面向大部分用户,RFM

        

        可以根据用户的各种行为,给用户打一个价值分,按照这个价值分来分配服务资源。

平均付费额度

        付费金额/全部人数

       这个算出来,就是单用户成本。你去投放流量的时候,尽量就不要高于这个“平均付费额度”的成本来拉新。 

付费率

付费用户的付费金额 

        

内容产品的指标

        请求、曝光、点击、阅读、评论/点赞/分享/收 藏/不喜欢

                点击多  且  阅读时间少  往往是标题党, 应该减少推荐

        CTR(click through rate)= 点击次数 / 曝光次数,专门用于评价一个推荐系统的好坏

渠道数据

渠道新增

        来源1:投放在其他平台和本平台的   引流的 贴片广告

        来源2:游戏行业的   游戏公会 做的社区运营

渠道

        付费/免费
        内渠/外渠

渠道的质量如何评估?

        评估标准:最大化投入产出比=拖入/产出

        投入产出比高的渠道,我们就合作。反之,不合作。

 渠道的付费标准有两个

        (1)CPA按照用户的操作情况,给渠道付费用:渠道拉新,每多一个用户注册或者购买,给渠道商2块钱。

        (2)CPS按照用户的付费情况,给渠道分成:每达成10元的用户支付,给渠道商分配利润的20%。

一般来说,一个产品或者系统上线 了,会先使用“(1)CPA按用户操作,支付渠道商费用”,把用户群体拉到一个足够大的量以后。用户基数足够大了以后,再做付费的转换,转而采用“(2)CPS按照用户付费情况,和渠道商分成”,从而把用户的质量提升起来,转而注重  利用渠道盈利 这个层面。

        比如你先用“(1)CPA”拉客户,渠道费用7000块,触及到了近万个用户,但是实际只有1000个用户愿意来注册,也就是说拉来了1000个用户(实际在花费这笔渠道费之前)

        

渠道作假的识别

        比如某些渠道为了拿更多的渠道费,用机器刷一批的机器人用户。;比如地推团队,在街上让人扫二维码注册,然后送你个钥匙扣。

        如何判断作假:(1)看用户留存率,(2)哪些用户只注册、不活跃,(3)注册后的用户是否付费

设备数据

手机

        机型:苹果、华为、小米、OV

        IMEL

电视:

        ott

操作系统

        win

        mac

        linux

浏览器

        chrome

        IE浏览器

                老版本IE,引导用户使用chrome来登录

        

        

OLTP与OLAP的区别

业务查询 数据分析查询
数据量 量少 量大
时效性 高 (快)
取数特点 按行 按列
名称 OLTP OLAP
Transaction事务 Analysis分析
数据库Database 数据仓库Dataware house

 OLTP

        类似于,你打开飞猪查自己过往的高铁票购买记录,是用户在查询自己这一个用户过去所有的消费记录。

        对时效性要求很高,就像你不能忍受查个购票记录20分钟以后才加载出来。

OLAP

        类似于,飞猪的数据分析师,用中国几个亿的飞猪用户的数据都取出来,统计一下春运这段时间所有飞猪用户今天的平均在交通出行消费了多少钱。

        毕竟调用的数据量这么大,自然可以接受2小时以后才能把所有数据都取出来,算出一个结果。

你可能感兴趣的:(数据分析,数据挖掘)