基于RFM模型的用户分类及精细化运营（附实例）

一、RFM模型简介

1、释义

RFM模型是衡量客户价值和客户创利能力的重要工具和手段。在众多的客户关系管理(CRM)的分析模式中，RFM模型是被广泛提到的。该机械模型通过一个客户的近期购买行为、购买的总体频率以及花了多少钱3项指标来描述该客户的价值状况。

R：最近一次消费 (Recency)：代表用户距离当前最后一次消费的时间

F：消费频率 (Frequency)：用户在一段时间内，对产品的消费频次

M：消费金额 (Monetary)：代表用户的贡献价值

image

一般情况下，我们将R、F、M分别分五个维度打分，通过归一化打分之后，把用户所打分值与所有用户的总分均值作高低比较，再将R、F、M每个方向定义为：高、低，两个方向，如此可将用户分为222=8类，如下：

image

当我们将客户分类后，便可以针对性指定精细化运营策略，帮助大家了解完RFM模型后，我将用一个实例具体展示操作流程，以下实例以某玩家作品网站为例，爬取前十个网页共240个玩家作品的昵称、编号、点赞数、积分、上传日期时间等信息进行分析，具体流程如下：

1 数据爬取

2 数据清洗

3 数据分析

3.1 重新定义RFM

3.2 定义RFM打分标准

3.3 归一化打分

3.4 计算RFM均值

3.5 用户分类

3.6 统计与可视化

4 运营策略

1 数据爬取


import requests
from bs4 import BeautifulSoup
import numpy as np
import pandas as pd
import warnings
warnings.filterwarnings('ignore')

#获取十个网页网址
url_lst=[]
for i in range(1,11):
    urli='http://www.minicap.com/works?page='+str(i)
    url_lst.append(urli)
    
print(url_lst)

#获取十个网页共240个作品的网址
word_lst = []
n = 1
for url in url_lst:
    ri = requests.get(url)
    soupi = BeautifulSoup(ri.text,'lxml')
    info=soupi.find('div',class_='list_det').find('ul').find_all('li',class_='zp_list')
    for i in info:
        urli=' http://www.minicap.com'+i.find('a')['href']
        word_lst.append(urli)
        print('成功获取第%i条网址'%n)
        n+=1
print(word_lst)

#获取240个作品的相关信息
def get_data(url):
    
    ri=requests.get(url=url)
    soupi=BeautifulSoup(ri.text,'lxml')
    dic = {}
    dic['num']=soupi.find('div',class_='news_l news_det_l').find('div',class_='det_cont sw').find('div',class_='det_fx').find('div',class_='fxr').find('div',class_='det').find('p',class_='p1 dls').text[3:]
    dic['author']=soupi.find('div',class_='news_l news_det_l').find('div',class_='det_cont sw').find('div',class_='det_fx').find('div',class_='fxr').find('div',class_='det').find('p',class_='p2 dls').text.split(' ')[0][3:]
    info=soupi.find('div',class_='news_l news_det_l').find('div',class_='det_cont sw').find('div',class_='det_fx').find('div',class_='fxr').find('div',class_='det').find('p',class_='p3 dls').text.split(' ')
    for i in info[:]:
        if ''in info:
            info.remove('')
        if '\n' in info:
            info.remove('\n')
    dic['date']=info[0]
    dic['time']=info[1]
    dic['integral']=soupi.find('div',class_='news_l news_det_l').find('div',class_='det_cont sw').find('div',class_='det_fx').find('div',class_='fx').find('div',class_='ndjj').find('span',class_='jj').text.replace(' ','')[3:]
    dic['like_num']=soupi.find('div',class_='news_l news_det_l').find('div',class_='det_cont sw').find('div',class_='det_fx').find('div',class_='fx').find('div',class_='ndjj').find('div',class_='dz_box').find('span',class_='dz_num').text
    return dic
    
info_list = []
n=1
for url in word_lst:
        info_list.append(get_data(url))
        print('成功获取第%i个网址的基本信息'%n)
        n+=1

2 数据清洗


#数据清洗
df=pd.DataFrame(info_list)
for i in range(len(df)):
    df['author'][i]=df['author'][i].split('\n')[0]
    df['like_num'][i]=df['like_num'][i].split('\n')[1]
print(df)

#查看数据维度和结构
print(df.dtypes)
print('-----------------')
print(df.info())

#修改数据类型
df['integral']=df['integral'].astype(int)
df['like_num']=df['like_num'].astype(int)
df['date']=pd.to_datetime(df['date'])
print(df.dtypes)

#数据保存
df.to_excel(r'C:\Users\Lenovo\Desktop\小瓶盖数据.xlsx')

3 数据分析

3.1 重新定义RFM

由于获取的是作品相关信息（获取信息有限），所以在此对RFM进行重新定义：

R：最近一次上传作品日期据今天几天；

F：作品数（用户最近一段时间内上传作品的数量）；

M：点赞数（用户最近一段时间内上传作品的点赞总数）

3.2 定义RFM打分标准

image.png

3.3 归一化打分

image.png

3.4 计算RFM均值

image.png

3.5 用户分类

将3.3与3.4比较得出用户分类

image.png

3.6 统计与可视化

image.png

image

4 运营策略

image.png

以上便是此次操作全过程，不当之处，还请指正，谢谢！

基于RFM模型的用户分类及精细化运营（附实例）

你可能感兴趣的:(基于RFM模型的用户分类及精细化运营（附实例）)