基于RFM模型和AHP分析法,划分用户等级和定位召回用户

背景:

配合精细化运营的需求,最近需要进行点对点推文以及用户召回,这就涉及到一个问题:召回谁?向谁点对点发文?很明显要对高价值的用户进行精细运营,那么问题的关键就是确定高价值用户。

问题聚焦:

量化用户价值,划分用户等级,再确定召回用户。

解决思路:

参考RFM模型:

RFM模型是衡量用户价值和用户创利能力的经典工具,依托于用户最近一次购买时间、消费频次以及消费金额。

RFM的含义:

R(Recency)最近一次消费时间:表示用户最近一次消费距离现在的时间。消费时间越近的客户价值越大。1年前消费过的用户肯定没有1周前消费过的用户价值大。

F(Frequency)消费频率:消费频率是指用户在统计周期内购买商品的次数,经常购买的用户也就是熟客,价值肯定比偶尔来一次的客户价值大。

M(Monetary)消费金额:消费金额是指用户在统计周期内消费的总金额,体现了消费者为企业创利的多少,自然是消费越多的用户价值越大。

基于这三个维度,将每个维度分为高低两种情况,我们构建出了一个三维的坐标系。

通过图表很直观的发现,我们把客户分为了2的三次方也就是8个群体。

如果某个用户最近一次消费时间距今比较久远,没有再消费了,但是累计消费金额和消费频次都很高,说明这个用户曾经很有价值也就是RFM模型中的重要保持客户,我们不希望他流失,所以运营人员就会专门针对这类型用户设计召回策略,同样条件下最近一次消费时间距今越短理论上也越容易召回,这也就是RFM模型的核心价值。当然这里有个默认前提:

(1)最近有过交易行为的客户,二次发生交易的可能性要高于最近没有交易行为的客户;

(2)交易频率较高的客户比交易频率较低的客户,更有可能发生二次交易;

(3)过去所有交易总金额较多的客户,比交易总金额较少的客户,更有可能发生二次交易。 

实现步骤:

基于2019年4月至12月的已支付订单数据

数据字段

1.确定R,F,M的值:

sql

得到RFM值

RFM值截图

2.划分高低维度

各指标分布:

 从分布图能看出,在数据呈现长尾分布,距现在3个月内最后一次付费(R),充值次数10次以内(F),充值金额100以内(M)的用户占据绝大多数。所以不能以平均数作为高低维度的划分标准,因此参考业务经验,以及确定召回用户群这一目标,具体划分如下:

用户价值排序

整体的用户价值如上,可针对特定用户群实行不同的运营策略。

1~3级:不推送促销活动,关闭年费功能。减少发文频率,但是保持客服的交流,微信会话和留言及时回复。

4~6:针对性推荐年会会员,保持交流。针对其喜好推送相关小说。

7~9:多为新关注用户,全部推荐年费会员,增加发文频率,且要多类型,最热的小说及时送达。

10~15:推送用户正在阅读小说的更新章节,做一些小促销激活

16~17:猜测多为休眠用户,或者已经取消关注,高频率的做促销活动,争取价值最大化

3.确定可召回用户

由上一步可确定召回用户群,共计55000名用户,范围过大,应该进一步细分。这里考虑用一个具体的值来衡量用户价值。从而使对用户的召回更具有先后顺序,减少运营成本,增加效率。

4.对用户价值进行量化

首先解决R、F、M三值量级不均衡的问题,然后计算RFM总值量化用户价值。可将三组数据利用min-max归一化,分别无量纲化处理映射至0到1的区间在合理放大然后相加。

量化公式

min是数组中的最小值,max是数组中的最大值。将数组中的数据依次经过上述公式处理,使其收敛到了0至1的区间之内。

量化处理后的结果

第一组源数据经过无量纲化处理后收敛至了0到1区间之内,可将不同量级的数据归一化至同一量级,归一化后的数据是一个位数极多的小数,而一般用户对于极小数和极大数没有直观的感受。

所以这里我把所有的数据同比放大了100倍,将源数据扩大到了0至100的区间,同时做了四舍五入,让数据可读性更强。经过这样的处理就将数据从原来不同量级无法直观对比,归一化到了0至100的区间,方便大家直观计算RFM总值。

最后计算RFM总值的公式如下:RFM总值 = R值*(-1)+F值+M值+100;

由于R值的大小和用户价值呈现反比,所以高于分位数的时候算低纬度,低于分位数时算高纬度。

公式中同样为了解决R值同F、M值统计维度不一样的问题,这里给R值乘以了负1,同时为了保证数据结果不会出现负数,又在最后加了100。这样处理之后保证最后的RFM总值落在了0至300的区间之内,让大家可以通过分值很直观的量化用户价值。

5.确定RFM的权重

在具体的操作的过程中,我们发现很多R值较大的用户,即使最终RFM值相对较高,但其实往往都已经取消关注了,所以按照本来的算法,R,F,M的权重是一样的,但考虑到用户唤醒这一目标,R值得权重应该要设置的比较高。另外还发现,F与M值呈现高度的正相关性,

通过计算两组数据的相关系数:

相关性检验

可以发现两组数据相关系数的0.8属于高度相关,也就是说充值频率高的用户充值金额也会很高,结合业务经验,分析原因应该是,在充值页面我们设置的充值选项只有几个,如30元,60元,100元,200元,F与M值的权重应该一样,甚至在最开始的RFM的模型中,F与M只用一个就可以,但是考虑到可能会有只充9.9促销活动的用户(F较高,M较小),这里M的权重要高于F,因此,三者的权重分别是R最高,M次之,F最小。这里R与M的权重大小的选择是基于,用户唤醒的成功率,经验表明R越小则成功率越高。至于具体的权重值,这参考层次分析法(AHP)。

6.层次分析法(AHP)确定权重值

层次分析法(Analytic Hierarchy Process,AHP)这是一种定性和定量相结合的、系统的、层次化的分析方法。这种方法的特点就是在对复杂决策问题的本质、影响因素及其内在关系等进行深入研究的基础上,利用较少的定量信息使决策的思维过程数学化,从而为多目标、多准则或无结构特性的复杂决策问题提供简便的决策方法。是对难以完全定量的复杂系统做出决策的模型和方法。

层次分析法的原理,层次分析法根据问题的性质和要达到的总目标,将问题分解为不同的组成因素,并按照因素间的相互关联影响以及隶属关系将因素按不同的层次聚集组合,形成一个多层次的分析结构模型,从而最终使问题归结为最低层(供决策的方案、措施等)相对于最高层(总目标)的相对重要权值的确定或相对优劣次序的排定。

层次分析法的步骤,运用层次分析法构造系统模型时,大体可以分为以下四个步骤:

1.建立层次结构模型;

2.构造判断(成对比较)矩阵;

3.层次单排序及其一致性检验;

4.层次总排序及其一致性检验;

针对我们的单一目标,只需做到第三部。在分别得到五位评价者的两两比较矩阵后,采取取平均的方法得到下表的评价矩阵。

评价矩阵A

又评价矩阵得到矩阵最大特征根的归一化特征向量[WR,WF,WM]=[0.504,0.187,0.307], 

上表所示的两两比较矩阵的一致性比例CI/RI < 0.1(RI 查表得出),表明该判断矩阵的一致性可以接受。因此由上表得出RFM各指标相对权重为[WR,WF,WM]=[0.504,0.187,0.307]

7.获取最终RFM值

RFM=-0.504*R':+0.187*F'+0.307*M'+100

最终按照分值由高到低进行用户回访和召回。

你可能感兴趣的:(基于RFM模型和AHP分析法,划分用户等级和定位召回用户)