用户分层方法

用户分层

1、分层实施的两大核心

  1. 处于不同层级的用户,需要能够被通过数据字段或标签等方式识别区分出来;
  2. 面向每一类用户的运营机制或策略是明确稳定的。

用户分层和用户分群的区别

用户分层是以用户价值为中心,在同一分层模型下,一个用户只会处于一个层级
用户分群是以用户属性为中心划分,一个用户会同时拥有多个属性。

2、分层的原则

  1. 科学性:正确有效的统计模型
  2. 可解释性:分层界限具有业务意义
  3. 业务适用性:可操作性强,业务覆盖广

3、分层的方法

方法名称 适用场景 方法内容
用户价值区隔分层 业务链条标准化高,用户间互相影响低 用户分层方法_第1张图片
AAARR模型分层 业务链条标准化高,用户间互相影响低 用户分层方法_第2张图片
金字塔模型 用户分层方法_第3张图片
用个性化特质&需求区分 业务链条标准化低 用户分层方法_第4张图片
以用户成长路径为中心 标准化高 互相影响高 用户分层方法_第5张图片

4、分层的流程

4.1 用户价值区隔流程

  1. 确定分层指标
    观测周期确定的原则:指标的累积覆盖度足够大(接近100%),且指标的覆盖度增量收敛(趋于稳定)
【目标用户有目标行为日日均行为指标】 表示用户一段时间内的平均能力
【目标用户每日行为指标】、目标用户观测周期累积行为指标】表示用户一段时间内的累积能力
【目标用户当日行为指标】表示当日的能力
	eg:
	● 最近30天付费日日均付费金额、最近30天自然日日均付费金额、最近30天付费天数
	● 最近30天区间的诜择:近30天付费用户对观测日非首次消费人数贡献度93.2%(覆盖度足够大),金额贡献度97.2%,且增量收敛(覆盖度随着天数的增加增速趋于平缓);
	○ 累积覆盖度
		■ 当日新付费用户,在t日人数占比~1.7%,金额占比~1.5%
		■ 历史付费用户在t日,人数占比~98.3%,金额占比~98.5%(下图为剔除新付费用户的累计占比,即最终收敛至100%,因展示限制下图为近40天)
	○ 覆盖度增量:
		■ 14天以上人数占比增量约在0.2pp,金额占比增量约在0.4pp;
		■ 30天以上人数、金额占比增量均收敛至0.1pp;
  1. 圈定分层对象:观测周期内有目标行为的对象
  2. 选择分层方法:帕累托最适 (适用于价值累积型变量指标)
帕累托最适(Pareto efficiency)
● 分层临界值涵意为上下两能力分层区间的最公平能力分配状态,用户能力透过向分层临界值靠近的帕累托改进过程,逐渐达到效率分配,直到帕累托最适状态;
● 通过比较能力人数分布、能力值分布,计算临界值;超过临界值意味著多数能力集中于少数人,低于临界值意味著少数能力分散于多数人之中; 	


eg:
y1:人数占比
y2:收入占比
交点表示:收入占比=人数占比;左侧代表人数占比>收入占比,多数人拥有少数财富
用户分层方法_第6张图片

  1. 分层特性
    ● 稳定性:用户在稳定的环境中,所属层级稳定不会小概率出现大的波动
    ● 分层数量:满足精细化运营,分层不宜过少
  2. 模型构建
    ● 付费金额与付费人数是典型的价值累积型变量,符合Pareto准则,服从Power law分布;
    Power law分布中,随机变量的X的概率密度函数为:

P ( X > x ) = ( x m i n / x ) k P(X>x) = (x_{min}/x)^{k} P(X>x)=(xmin/x)k
注:t分布是也是幂律分布

你可能感兴趣的:(统计,人工智能,数据挖掘)