我是小z
数据指标体系是构建数据中台的重要一环。数据指标的建立让运营及产品人员更直观地看到基本指标的变动,让数据分析师更便捷地开展数据分析工作。这篇文章就紧紧围绕“指标体系”展开,内容略干。
数据指标就是将大数据之“大”的精髓给提炼出来,展现每日观察数据的使用者最迫切想要看到的统计量。数据指标体系并不是第三方服务公司的专利,只要对埋点科学地进行数据采集,每个成型的互联网公司都可以自己搭建数据指标体系。
数据之大,很多时候人们并不知从哪里着手,甚至弄不清自己到底想要什么数据,这时候数据产品经理这一角色应运而生。数据产品经理既要完成数据体系设计,让原本无序或庞杂的数据变得“规矩”,又要根据业务场景的变化不断调整项目内容,推进项目进度,推进数据指标体系的建设与迭代。数据指标体系的规划是平台型数据产品经理必备的能力,这也是数据产品经理有别于其他产品经理和数据分析师的方面。
数据指标体系的概念和价值
《荀子》有云:“水能载舟,亦能覆舟。”在公司日常运营过程中,数据指标体系就像是水,孕育着生命,承载着万物。科学的数据指标体系能指引公司在正确的道路上不断前进,或者使平淡无常的业务焕发新生,而不合理的数据指标体系可能使得业务方无所适从。
01
什么是数据指标体系
在了解什么是数据指标之前,我们思考一下为什么会出现指标,它是为了解决什么问题。人类及科学的发展是与时俱进的,早期为了使自然科学的实验及结果更具统一性及方便标准化衡量,一些标准化的专业指标应运而生。随着人类社会的发展,社会科学也越来越需要统计学来进行事物的衡量,一系列统计学指标也逐步产生了。随着新信息技术的发展,数据指标逐步被大众认可为衡量目标的方法。
从社会科学角度看,指标是统计学的范畴,用于数据的描述性统计。指标是说明总体数量特征的概念及其数值的综合,故又称为综合指标。在实际的统计工作和统计理论研究中,往往直接将说明总体数量特征的概念称为指标。传统的指标有国内生产总值(Gross Domestic Product,GDP)、国民生产总值(Gross National Product,GNP)、居民消费价格指数(Consumer Price Index,CPI)、沪深300指数等。
什么是数据指标
数据指标有别于传统意义上的统计指标,它是通过对数据进行分析得到的一个汇总结果,是将业务单元精分和量化后的度量值,使得业务目标可描述、可度量、可拆解。数据指标需要对业务需求进行进一步抽象,通过埋点进行数据采集,设计一套计算规则,并通过BI和数据可视化呈现,最终能够解释用户行为变化及业务变化。常用的数据指标有PV、UV等。
本文提及的指标是衡量目标的方法,指标由维度、汇总方式和量度组成(见图1)。其中,维度是指从哪些角度衡量,是看待事物的视角与方向,决定了根据不同角度去衡量指标。汇总方式是指用哪些方法衡量,是统计汇总数据的方式。而量度主要是明确事物的具体目标是什么,是对一个物理量的测定,也用来明确数据的计量单位。
图1 指标的构成
比如,播放总时长是指用户在一段时间内播放音频的时长总和(单位:分钟)。按照上述拆解,维度是指筛选的一段时间,汇总方式为计算了时间长度的总和,而量度就是统一的单位—分钟数。
这里,我们可以理解为指标是由这几个方面构成,相当于英文的构词法,前缀、后缀等共同形成了一个单词。
什么是指标体系
体系化的本质是将数据指标系统性地组织起来,具体会按照业务模型、按标准对指标不同的属性分类及分层。当然,不同的业务阶段、不同业务类型会有不同阶段的划分标准。
数据指标体系含有十分丰富的统计量,从宏观上看,它是一个相对全面的有机整体;从微观上看,每个数据指标都有其特定含义,反映了某一细节的客观事实。不同的数据指标定义不同,逻辑也不同,这些各种各样的统计量共同构成了数据指标体系,使其产生不可磨灭的价值。
总的来说,数据指标体系是对业务指标体系化的汇总,用来明确指标的口径、维度、指标取数逻辑等信息,并能快速获取到指标的相关信息。
02
数据指标体系的价值
数据指标体系是业务数据标准化的基础,其对指标进行了统一管理,体系化是为了方便统一修改、共享及维护。
宏观方面,数据指标体系建设是数据中台建设的重要一环,不仅符合“创新驱动”的意识,更是企业实现自身“数据驱动”发展的重要途径。
随着大数据和人工智能技术的发展,很多企业选择借助信息技术实现转型升级。在大数据时代早期,大部分数据并没有被充分地挖掘分析和利用。虽然数据规模非常大,但是却很难利用这些数据创造价值。而数据中台的提出及数据指标体系的构建,使得数据产生了实际价值。有了数据指标,人们做决策时不再是按照经验“拍脑袋”,而是看看数据是怎样呈现的,能够及时基于数据进行战略调整及决策规划。
数据指标体系的价值主要体现在全面支持决策、指导业务运营、驱动用户增长,同时统一统计口径(见图2)。其中,作为压轴作用的统一统计口径对于数据指标体系而言具有战略意义。在一个整体中,如果不能统一口径,那么一切分析及对比的参考价值就会显得无意义,各方也会陷入公说公有理,婆说婆有理的尴尬局面。由此说明,对于衡量整个公司的业务价值而言,建立一套统一标准的数据指标体系的作用不言而喻。
图2 数据指标体系的价值
1、全面支持决策
数据指标极具参考价值,公司的管理层为了更准确地进行战略决策,需要搭建完备的数据指标体系。一个相对全面的数据指标体系,可以让管理者对公司的发展从数据层面有一个比较客观的认知,而不是管中窥豹,这样在进行战略决策时,可以保持相对理性。而对于新业务的洞察,也可以不断融入新的数据指标,丰富指标体系,灵活且全面地把握业务发展趋势,为未来的决策提供借鉴。
2、指导业务运营
不懂数据的产品不是好运营,为了便捷地了解产品现状及业务效果,指标体系中会有很多拆解的细分指标,这些数据的变动反映的是用户对于运营情况的最新反馈,为运营的业务决策提供了数据支持。用户运营可以根据这些数据,了解用户的喜好,决定下一步的运营策略和活动开展。例如,对于阅读行业来说,内容编辑会基于自己对内容的认知,将一组有共性特征的书籍组成一个书单推送给用户,那么指标体系中也会有相应的指标反映用户对这个书单的偏好。内容编辑就可以通过这些指标,了解用户的偏好,决定下一步是否要继续尝试这种类型的专题。
3、驱动用户增长
最近最火的词莫过于用户增长,数据指标体系中的用户行为数据,可以让产品及运营人员对用户的行为路径和喜好模式有一个比较深入的理解。剖析用户的行为特征,助力用户价值的提升,让产品及运营更聚焦于产品细节的优化,更好地进行监测,提升用户留存及转化。人们在分析和挖掘用户行为的过程中,也许会发现不少新的用户增长点。体系化的指标结合了用户的场景,且多个不同的指标和维度可以串联起来进行全局分析,解决了非体系化指标无法串联的痛点。公司在深入进行数据分析后,可能会在原有业务中发现某个点潜藏着巨大商业价值,从而单独把这块业务重点推进,实现用户增长的二次腾飞。
4、统一统计口径
从技术角度来看,数据中台是为了汇总与融合企业内的全部数据,甚至外部数据,打破数据隔阂,解决数据标准与口径不一致的问题。数据指标体系化有个好处是可以实现指标的统一管理,实现统一的统计口径,避免定义模糊和逻辑混乱,影响数据质量。同时,完备的数据指标体系也可减少重复统计的问题,从而避免日志上报产生的数据冗余和重复分析产生的服务器资源浪费。
数据指标的分类
由于人们日常工作中接触的业务类型众多,各个业务所需要衡量的数据指标也如森林万物一般数量众多。界门纲目科属种是研究生物分类的方法,虽然数据指标不如生物体系般纷繁复杂,但是数据指标根据自身规律也有一定的
类别。
01
指标的类型
正如前面提及的,维度、汇总方式、量度构成了指标。单纯从技术角度对指标进行分类,指标的主要类型有基础指标、复合指标和派生指标,如图3所示。
图3 指标的主要类型
基础指标等同原子指标,主要是指不能再拆解的指标,通常表达业务实体原子量化属性的且不可再分的概念集合,如订单数、DAU等。
复合指标是建立在基础指标之上,通过一定运算规则形成的计算指标集合,如ARPU值、人均阅读章节数。
派生指标是指基础指标或复合指标与维度成员、统计属性、管理属性等相结合产生的指标。派生指标=一个原子指标+时间周期修饰词+其他修饰词,即派生指标是对原子指标业务统计范围的圈定。
时间周期指用来明确数据统计的时间范围或者时间点,比如近3日、近7日、自然周、当日等。修饰词指除了统计维度以外指标的业务场景限定抽象。原子指标和度量含义相同,是基于某一业务事件行为的度量,不可再拆分。
02
数据指标的类型
区别于传统技术上对数据指标的分类,我们根据日常业务及需求的需要将数据指标分为埋点数据、业务数据、财务数据、复合数据这几大类(见图4)。
图4 数据指标的类型
1、埋点数据
(1)数据采集
埋点数据为通过埋点可获得的用户行为的数据,此埋点为在前端及客户端进行开发的埋点,统一上报至大数据进行解析,通过大数据技术处理最终可得每个埋点的详细数据及埋点所带的信息。一些非电商行业的互联网公司,为了更纯粹地进行用户行为及用户路径的分析,将与业务(如充值消费金额)有关的数据上报至服务端,前端及客户端的埋点能满足基本用户行为分析的需要。
埋点数据是由单个或者一系列产生用户日志行为的埋点构成,时间维度也会使得同一埋点在不同条件下产出不同值。
(2)基本埋点指标
由上面的介绍可知,用户行为数据均通过埋点采集,接下来开门见山地介绍数据指标体系中主要的基本埋点数据指标的逻辑定义。这是关键的指标,也是各公司各个部门最关注的指标,产品、运营、商务以及你的老板每日都会看。大数据开发工程师也是根据数据指标的逻辑定义进行平台开发的。以下主要以App客户端为例来讲解,Web端产品的一些统计情况同理。
App客户端的基本埋点数据指标如下。
启动用户数:当日有过启动行为的用户数,也称为日活(DAU),通过UID排重。
新增用户数:当日为历史首次启动的用户数,通过UID排重。
启动次数:当日启动页的展示量,不排重。
某页页面访问量:当日某页面的流量次数,即该页PV。
平均使用时长:日使用时长的均值,即全部用户的日使用时长/总活跃用户数,技术进行数据清洗时需排除小于0或大于1440分钟(24小时)的脏数据。
平均日启动次数:用户一天内启动应用的次数,即总启动次数/活跃用户数。
次日启动留存:次日启动用户且在当日启动用户中的用户占当日启动用户的比例。
次日新增留存:次日活跃用户且在当日新增用户中的用户占当日新增用户的比例。
标的物被浏览数:当日用户浏览标的物的总数,通过标的物ID排重。
拉活新增用户数:当日通过deeplink(深度链接)进入App的新增用户数,通过UID排重。
签到人数:当日点击签到的人数,通过UID排重。
某按钮/Banner/入口点击人数:当日该页某按钮/Banner/入口点击的人数,通过UID排重。
其中,新增用户数及日活等均是通过服务端的用户表进行统计的。单一的原子指标加上维度会形成派生指标。以下派生指标也是比较常用的数据指标。
累计用户数:历史新增用户数叠加,前一日累计用户数+今日新增用
户数。
7日平均新增用户:T-7日至T-1日每日新增用户的平均值,即7日新增用户的总和/7。
7日平均次日留存率:T-7日至T-1日次日留存率的平均值,即次日留存率的总和/7。
7日平均日使用时长:T-7日至T-1日用户每日使用时长的平均值,即7日使用时长的总和/7。
7日平均活跃用户:T-7日至T-1日每日活跃用户的平均值,即7日活跃用户的总和/7。
周活(WAU):近7日活跃用户的总和,通过UID排重。
月活(MAU):近一个月活跃用户的总和,通过UID排重(以自然月计算)。
以上埋点数据构成了基本的数据指标,该指标默认情况下展示总数,当然也可以根据情况,选择产品线的不同App、版本与渠道,来观察某渠道下某App某版本的以上详细指标;还可以通过埋点msg字段带的投放素材编号,在自定义素材查询中查询某投放素材在某日拉活的总量,也能观察到该素材拉活后7日内每天的留存率。
2、业务数据
(1)业务数据与派生指标
前面提到,涉及金额的数据会上报至服务端,服务端存储着日常的充值消费等业务数据。在介绍业务数据的实例之前,我们先介绍一下派生指标。派生指标与业务数据联系十分紧密。业务不是单纯的一个环节,通常情况下是由多个流程构成,由此简单的、不可拆解的原子指标就如英文单词加上前缀、后缀一样组成了派生指标。
派生指标分为3类:事务型指标、存量型指标和复合型指标。事务型指标是对业务活动进行衡量的指标,例如新增注册会员数、当日充值会员金额,这类指标需要维护原子指标及修饰词,在此基础上创建派生指标。存量型指标是对实体对象某些状态的统计,例如注册会员总数、充值金额总额,这类指标需维护原子指标及修饰词,在此基础上创建派生指标,对应的时间周期常为“历史某时间截止到当日”。复合型指标将放在本节第4小节讲解。
(2)常用业务数据指标
下面是常用的业务数据指标及其具体定义。
充值用户:当日充值的用户数。
充值额度:当日用户充值的总金额(元)。
消费总用户:当日消费的用户数(包括真钱、代金券消费)。
消费真钱用户:当日消费真钱的用户数。
消费真钱:当日用户消费的真钱的总金额(元)。
充值次数:当日用户充值的总次数。
首充人数:当日第一次充值的用户数。
首充金额:当日第一次充值的用户充值的总金额(元)。
赠送代金券:当日赠送给通过相应充值方式充值的用户的代金券。
消费次数:当日用户在相应消费额度范围内的消费次数。
消费用户:当日在相应消费额度范围内的消费用户数。
(3)业务数据之会员数据建设实例
会员制是一种人与人或组织与组织之间进行沟通的媒介,它由某个组织发起并在该组织的管理运作下吸引客户自愿加入,目的是定期与会员联系,为他们提供具有较高感知价值的利益包。
会员制兴起于线下门店,那时候互联网还未风靡,各行各业的门店会给长期光顾其门店的用户提供会员增值服务,人们去喜爱的商店消费需要带上实体会员卡,每个品牌实体卡片都很精致,且有用户的唯一标识,这就是早期的会员制雏形。后来,随着CRM的发展,登记用户的手机号即可,会员到店报手机号也可享受积分或者优惠打折等服务。
近年来,移动互联网纷纷抓住传统企业增强用户黏性的这一法宝,也开始推行会员制,且有收费机制,比如电商领域淘宝的88VIP会员、视频领域的爱奇艺会员。会员发展也日趋精细化,小红书及网易云音乐的月度会员、季度会员、包年会员等各种方式层出不穷。在这些纷繁复杂的活动背后,产生了一个又一个不同的数据,增长了一波又一波的销量,促使活动设计者体察其背后更精细化的运营。打好会员运营这张牌,显得尤为重要。
接下来分享业务数据中关于会员指标建设的实例以供大家参考,也是一些基本但又十分重要的指标。会员数据属于业务数据的一部分,包含会员人数、会员收益、会员赠送等。当然,不同公司关于会员这块的复杂度不同,以下特指最基本的示例。各位读者可根据各家业务发展情况,进行细化补充及
调整。
会员人数页面
累计会员人数:历史累计至今开通过会员的总人数。
有效会员人数:当日会员仍在有效期内的人数。
当日购买会员人数:当日产生购买行为的人数,即新开通人数+老会员续费人数。
新开通人数:未曾开通过会员的用户在当日首次开通的人数。
老会员续费人数:曾开通过会员的用户在当日续费或再次开通的人数。
当日会员失效人数:当日会员有效期到期的人数。
当日复购人数:当日该会员类型有效期到期的用户中再次购买会员的人数(含任意会员类型)。
当日复购率:当日复购人数/当日会员失效人数。
以上不包含赠送VIP的情况。
会员收益页面
累计会员收益:历史累计至今的会员收益总额(单位:元)。
当日会员收益:当日开通会员的收益总额,即新开通会员收益+老会员续费收益(单位:元)。
新开通会员收益:未曾开通过会员的用户在当日首次开通会员的收益总额(单位:元)。
老会员续费收益:曾开通过会员的用户在当日续费或再次开通的收益总额(单位:元)。
ARPU值:当日人均会员收益,即当日会员总收益/当日购买人数。
会员赠送页面
赠送VIP人数:当日赠送VIP的总人数,包含新手礼包、会员奖品、手动赠送等非消费产生的VIP。
赠送VIP失效人数:当日内有效期到期的赠送VIP人数。
赠送VIP在失效当日购买人数:有效期在当日到期的赠送VIP的人中购买会员的人数(含任意会员类型)。
赠送VIP在失效7日内购买人数:有效期在7日内到期的赠送VIP的人中购买会员的人数(含任意会员类型)。
3、财务数据
(1)互联网基本财务数据指标
前面提到,构建数据指标体系价值的第一点就是全面支持决策,管理者每日最关注的是企业的营收增长状况。相较于文字,管理者更愿意相信数字展现的事实。前一日的收入、成本、盈利是企业管理者最关注的指标,在数据监测日报页面,也需要将一些基本的财务指标体现出来,该页面的权限为特定管理者,基层员工无权限查看核心财务数据。
由于每个互联网企业的商业模式不同,财务数据公式的选取也应该根据公司需求而异。数据产品经理应该了解到管理者的监测需求,联合财务部门及涉及金额的部门进行反复沟通,确定好基本财务数据指标的计算方式。
(2)专业财务数据指标拓展
通过对财务数据指标的构建,企业能便捷地在BI平台进行财务分析。财务分析是指运用特定技术和方法,依托会计、报告和其他相关数据,根据不同的财务分析实施主体和目的,对企业的经营能力、盈利能力、偿付能力、增长能力等进行分析评价,可了解企业的过往、评估其现状乃至预测未来,为正确的决策提供判断依据。
① 偿债能力
企业的偿债能力包括短期偿债能力和长期偿债能力。企业的短期偿债能力与企业的流动资产和流动负债密切相关,企业的长期偿债能力与企业的资本结构及企业的盈利能力相关。企业偿债能力财务指标见表1。
② 企业营运能力分析
营运能力分析不但可以评价企业资产营收的效率,也可发现企业在资产营运中存在的问题。企业营运能力分析财务指标见表2。
③ 盈利能力
企业通过经营管理的投资活动获取净利润的能力为盈利能力。企业盈利能力财务指标见表3。
4、复合数据
复合数据是在事务型指标和存量型指标的基础上复合而成的。有些需要创建新原子指标,有些可以在事务型和存量型原子指标的基础上增加修饰词得到派生指标。复合数据一般有比率型、比例型、变化量型、变化率型、统计型和排名型。
CPA(Cost Per Action,每注册成本):获取一个新注册用户对应的价格,即总消费/注册数。
GMV(Gross Merchandise Volume,成交总额):一定时期内某网站的成交总金额,GMV=销售额+取消订单金额+拒收订单金额+退货订单金额,即GMV为已付款订单和未付款订单两者之和。
ARPU(Average Revenue Per User,每用户平均回报):统计周期内的总收入/活跃用户数,即日ARPU=日收入金额/DAU,周ARPU=周收入金额/WAU,月ARPU=月总收入金额/MAU。
ARPPU(Average Revenue Per Paying User,每付费用户平均回报):某时间段内平均每个付费用户为应用创造的收入。在用户数量上,ARPPU只考虑某一时间段内的付费用户,而非该时间段内所有的活跃用户。ARPPU=统计周期内的收入金额/付费用户数,即日ARPPU=日收入金额/日付费用户数,周ARPPU=周收入金额/周付费用户数,月ARPPU=月收入金额/月付费用户数。
CTR(Click Through Rate,广告的点击率):广告点击次数占广告展示次数的百分比。CTR=实际点击次数/展示量×100%。
CPM(Cost Per Mille,每千人成本):广告被展示1000次对应的价格。
ROI(Return On Investment,投资回报率):特定时期内广告主通过广告投放收回的价值占广告投入的百分比。
本文摘编自《数据产品经理:实战进阶》,经出版方授权发布。