RMF客户消费行为评分模型
RMF模型说明
RMF模型是客户管理中,常被用来衡量客户价值和客户创利能力的重要方法。它主要考量三个指标:
最近一次消费-Recency:近期购买的客户倾向于再度购买
消费频率-Frequency:经常购买的客户再次购买概率高
消费金额-Monetary:消费金额较多的客户再次消费可能性更大
根据上述三个维度,对客户做细分,假定每个维度划分成五个等级,得到客户的R值(1-5),F值(1-5),M值(1-5)。那么客户就被分作5*5*5 <- 125个细分群,我们可以根据客户交易行为的差异针对不同群体做不同的推荐。
或者进一步针对不同的业务场景,对R、F、M赋予不同权重Wr、Wf、Wm,得到每个用户的得分:W=Wr*R+Wf*F+Wm*M。根据最终得分W排序,再划分等级,采用不用的营销策略。
RFM模型其实很简单,其重点应该是在:一,如何做划分,不管是针对三个维度的划分还是三个维度取不同权重的和W的划分,都要依据实际业务场景情况确定。二,针对不同的客户群如何选定合适的营销手段,这个则需要对每个客户群体有正确的解读,并且对实际业务场景理解比较深入。
R语言实现RMF
用来做分析的数据应该是一段时间里累计的客户的消费记录,每笔记录至少需要客户名称、消费时间、消费金额三个要素。
用R生成模拟随机消费记录数据。客户编号为1000-1999共100人,消费记录10000条,消费记录产生时间在2014-01-01到2015-12-29之间。
观察数据结构:
> str(sales)
'data.frame': 10000 obs. of 4 variables:
$ 用户ID : int 1017 1583 1351 1013 1720 1938 1770 1319 1896 1067 ...
$ 消费金额: num 157 201 228 199 302 173 131 218 191 232 ...
$ 消费时间: Date, format: "2014-01-01" ...
$ 距离时间: num 1565 1565 1565 1565 1565 ...
> head(sales)
用户ID 消费金额 消费时间 距离时间
1 1017 157 2014-01-01 1565
2 1583 201 2014-01-01 1565
3 1351 228 2014-01-01 1565
4 1013 199 2014-01-01 1565
5 1720 302 2014-01-01 1565
6 1938 173 2014-01-01 1564
客户编号为1000-1999共100人,消费记录10000条,消费记录产生时间在2014-01-01到2015-12-29之间。
根据上述消费记录,得到Recency、Frequency、Monetary的值。
总消费金额:
sales$距离时间 <- round(as.numeric(difftime(Sys.Date(),sales[,3],units = "days")))
names(salesM) <- c("用户ID","总消费")
消费次数:
salesF <- aggregate(sales[,2],list(sales$用户ID),length)
names(salesF) <- c("用户ID","消费次数")
最近一次消费时间:
saleR <- aggregate(sales[,4],list(sales$用户ID),min)
names(salesR) <- c("用户ID","最近消费时间")
test1<- merge(salesF,salesR,"用户ID")
salesRFM<- merge(salesM,test1,"用户ID")
> head(salesRFM)
用户ID 总消费 消费次数 最近消费时间
1 1000 1281 8 855
2 1001 1442 8 1019
3 1002 919 5 887
4 1003 1437 7 893
5 1004 1461 8 917
6 1005 964 7 970
根据上述说明,对三个维度每个维度划分为5个层次,做均值划分。并给R、F、M分别赋权重0.5,0.3,0.2来求客户最终得分,客户最终得分在1-5之间。
salesRFM0 <- salesRFM
salesRFM0$rankR <- cut(salesRFM$Recency,5,labels=F)
salesRFM0$最近消费时间 <- cut(salesRFM$Recency,5,labels=F)
salesRFM0$rankR <- cut(salesRFM$最近消费时间,5,labels=F)
salesRFM0$rankR <- 6- salesRFM0$rankR
salesRFM0$rankF <- cut(salesRFM0$消费次数,5,labels=F)
salesRFM0$rankM <- cut(salesRFM0$总消费,5,labels=F)
salesRFM0$rankRMF <- 0.5*rankR + 0.3*rankF+ 0.2*rankM
salesRFM0$rankRMF <- 0.5*salesRFM0$rankR+0.3*salesRFM0$rankF+0.2*salesRFM0$rankM
> head(salesRFM0)
用户ID 总消费 消费次数 最近消费时间 rankR rankF
1 1000 1281 8 855 5 2
2 1001 1442 8 1019 4 2
3 1002 919 5 887 5 1
4 1003 1437 7 893 5 2
5 1004 1461 8 917 5 2
6 1005 964 7 970 4 2
rankM rankRMF
1 2 3.5
2 2 3.0
3 1 3.0
4 2 3.5
5 2 3.5
6 1 2.8
对Receny、Frequency、Monetary标准化后,以权重权重0.5,0.3,0.2来求客户最终得分,客户最终得分在0-1之间。
> salesRFM1$rankF <- (salesRFM1$消费次数-min(salesRFM1$消费次数))/(max(salesRFM1$消费次数)-min(salesRFM1$消费次数))
> salesRFM1$rankM <- (salesRFM1$总消费)-min(salesRFM1$总消费))/(max(salesRFM1$总消费)-min(salesRFM1$总消费))
Error: unexpected ')' in "salesRFM1$rankM <- (salesRFM1$总消费)-min(salesRFM1$总消费))"
> salesRFM1$rankM <- (salesRFM1$总消费-min(salesRFM1$总消费))/(max(salesRFM1$总消费)-min(salesRFM1$总消费))
> salesRFM1$rankRMF <- 0.5*salesRFM1$rankR+03*salesRFM1$rankF+0.2*salesRFM1$rankM
> head(salesRFM1)
用户ID 总消费 消费次数 最近消费时间 rankR
1 1000 1281 8 855 0.9649805
2 1001 1442 8 1019 0.6459144
3 1002 919 5 887 0.9027237
4 1003 1437 7 893 0.8910506
5 1004 1461 8 917 0.8443580
6 1005 964 7 970 0.7412451
rankF rankM rankRMF
1 0.2777778 0.2621606 1.3682557
2 0.2777778 0.3076923 1.2178290
3 0.1111111 0.1597851 0.8166522
4 0.2222222 0.3062783 1.1734476
5 0.2777778 0.3130656 1.3181254
6 0.2222222 0.1725113 1.0717915
以上用到的权重需要根据实际情况考量选定。得到的客户评分rankRMF,是客户细分的一个参考依据,实际场景中,我们可能还有客户的其他数据,可以综合来看。
参考:
http://www.idatacamp.com/2015/10/09/r%E8%AF%AD%E8%A8%80%E5%AE%9E%E7%8E%B0rfm%E6%A8%A1%E5%9E%8B/