数据分析的十大模型分别该怎么分析和应用呢?下面是笔者参考神策数据分析模型白皮书的一些理解和总结,欢迎大家一起来交流。
1. 事件分析概述
事件分析是指对具体的行为事件进行指标加工的一种方法,常见的指标计算规则为行为事件发生的人数、次数、人均次数,以及针对行为事件的属性特征进行特殊运算,如去重、求和、求均值等。
2. 事件分析应用示例
事件分析通用的分析方法是先定义对应指标的事件,再从其他多个维度进行细分下钻,比如“时间”、“地区”、“操作系统”等,查看指标数据的特征表现。如基于时间维度进行对比观测指标(日活跃用户数)波动是否有异常。
1. 漏斗分析概述
漏斗分析是指将某个业务场景中关联的事件,根据发生的先后顺序进行组织,从而系统性了解用户的转化效率。
漏斗分析不但可以整体性的反映用户在一定时间周期内,浏览网站或者APP中从起点到终点的转化率,而且还可以分析浏览过程中每一次跳转所产生的留存和流失,这样就能够直观地发现异常数据,从而通过分析根因找到问题所在,最后通过优化该环节来达到提升转化率的目标。
2. 漏斗分析应用示例
漏斗分析模型已经广泛应用于渠道来源分析、新用户激活、核心主流程优化、搜索功能优化等日常数据运营工作中。如用户某流程核心路径为。。。,如果整体转化率较低,则可根据漏斗分析查看各步骤转化率,直观地发现问题所在,从而进行针对性的优化。
1. 用户路径分析概述
与漏斗分析模型不同,漏斗分析模型是分析既定的行为转化,如电商产品中用户从浏览产品详情到最终支付每一步的转化率。而全行为路径是根据用户在APP或网站中的访问行为,分析用户在各模块中跳转规律与特点,挖掘出用户的群体特征,进而实现业务指标:如提升核心模块的到达率、APP产品设计的优化改版、流失用户去向分析等。
1. 留存分析概述
留存分析是一种用来分析用户参与情况和粘性的分析模型,考察发生了初始行为的用户中,有多少人会在后续的几天里面发生后续行为。这是用来衡量产品对用户价值高低的重要方法。
定义:满足某个条件的用户,在某个时间点有没有进行回访行为。
公式:若满足某个条件的用户数为N,在某个时间点进行回访行为的用户数为M,那么该时间点的留存率就是M/N。
1. Session分析概述
对于网站或者APP而言,用户一系列行为是一次访问,也就是一个Session。Session分析法是用来分析把用户单点发生的行为串联起来形成一个整体的前提下,Session整体或者Session中某个特定事件的访问特征。常见的指标分为Session整体的次数、人数、时长、深度、跳出率等,以及Session中某个特定事件的次数、人数、时长、退出率等。
以某网站为例,用户在一次访问中,诸如“用户平均会来几次”、“每次平均逛了几个页面”、“每次来评价呆多久”、“某个具体页面用户平均停留多长时间”这样的问题都需要通过Session分析解决。通过Session分析,可统计用户在网站或者APP中的整体访问深度、以及某些特殊节点的访问情况,从而在产品或者运营层面输入优化策略。
1. 热力分析概述
热力分析即应用一种特殊高亮的颜色、数据标注等,显示页面或者页面组(结构相同的页面,如商品详情页、官网博客等)区域中不同元素点击密度、触达率、停留分布等特征。热力分析法主要用来分析用户在页面上的点击、触达深度等情况,并以直观的效果展示给使用者,比较直观的表现了用户在产品页面上的浏览偏好,有力的说明了用户和网页的交互情况。
按计算维度划分,热图可以分为点击热图和浏览热图。
1. 归因分析概述
归因分析一般用于广告投放的渠道归因,将用户点击行为的“贡献”合理地分配到每一个渠道,通过渠道归因来衡量渠道的效果,亦可指导业务人员在渠道投放时合理分配投入。
常见的归因思路有下面几种:
1)首次归因
多个待选中触点时,认为第一个的功劳为100%。理由是第一个触点给用户建立了认知,与用户形成了连接。适用于重视新用户线索的业务。
2)末次归因
多个待选中触点时,认为最后一个的功劳为100%。这种思路适用范围最为广泛,常用于电商业务的站内归因的计算。
3)线性归因
多个待选中触点时,认为每个“待归因事件”平均分配此次功劳。适合坑位效果比较平均的产品。
4)位置归因
多个待选中触点时,认为第一个和最后一个各占40%功劳,其余平分剩余的20%功劳。兼顾最初的线索和最终的决策。
除此之外,还有“时间筛选归因”、“末次非直接点击”的归因计算思路,在实际的应用过程中,需要根据自身业务特点来选择合适的归因方法。
1. 间隔分析概述
间隔分析指的是用户行为与行为之间的间隔时长。如新用户进入注册页面,到完成注册的间隔时长,反映了注册流程的顺畅程度;用户发生两次充值之间的间隔时长,反映了用户的充值周期等。
在一些场景下,通过对间隔时长分布的观察,可以得到对产品或者用户的洞察,从而知道我们发生下一步的业务动作。例如,通过对用户开始注册和注册成功两个行为之间的时长分布,我们可以获知用户完成注册普遍所需要花费的时长,当某天注册成功率没有发生明显波动,而时长的分布整体变长时,我们则需要检查注册验证码的短信通道是否畅通、后台注册接口是否正常等。
1. 分布分析概述
分布分析是用户在特定指标下的频次、总额等特征的结构化分段展现。分布分析是了解数据分布表现的主要方法,往往能通过对数据结构的分层分析,判断极端数值的占比、对整体数据的影响,同时了解数据分布的集中度,以及主要的数据分布的区间段是什么。从事件在不同维度中的分布来观察,我们可以了解该事件除了累计数量和频次这些简单指标之外,洞察数据在分布特征上的特点,便于了解业务的健康度、分层结构等信息。
常见的分布模型一般包含以下类型:事件频率、一天内的时间分布、消费金额的区分等。
分布分析价值主要体现在以下几个方面:
1. 属性分析概述
属性分析指在分析行为事件特点的同时,也需要对触发事件的用户本身来分析。属性分析通过对用户各类特征进行标示,从而了解用户的属性,或者属性交叉的分布结构,进而可以对用户进行分层标记,以便进行后续的产品、运营动作。
属性分析可对基础属性、社会关系、行为特征、业务表现特征等进行结构分析。基础属性包含姓名、年龄、家庭、婚姻状况、性别、最高教育程度等;社会相关包含已婚未婚、有无小孩等属性;行为特征包含注册时间、用户首次访问渠道来源等;业务相关属性则是从业务数据中提取,如业务为健身相关,那么可能会包含体脂率等。
属性分析的价值主要体现在丰富用户画像维度,让用户行为洞察粒度更细。
参考文章:
神策数据-用户行为洞察研究院——十大数据分析模型详解
(网盘链接-密码: 1h7m)