一、RFM模型简介
1、释义
RFM模型是衡量客户价值和客户创利能力的重要工具和手段。在众多的客户关系管理(CRM)的分析模式中,RFM模型是被广泛提到的。该机械模型通过一个客户的近期购买行为、购买的总体频率以及花了多少钱3项指标来描述该客户的价值状况。
R:最近一次消费 (Recency):代表用户距离当前最后一次消费的时间
F:消费频率 (Frequency):用户在一段时间内,对产品的消费频次
M:消费金额 (Monetary):代表用户的贡献价值
一般情况下,我们将R、F、M分别分五个维度打分,通过归一化打分之后,把用户所打分值与所有用户的总分均值作高低比较,再将R、F、M每个方向定义为:高、低,两个方向,如此可将用户分为222=8类,如下:
当我们将客户分类后,便可以针对性指定精细化运营策略,帮助大家了解完RFM模型后,我将用一个实例具体展示操作流程,以下实例以某玩家作品网站为例,爬取前十个网页共240个玩家作品的昵称、编号、点赞数、积分、上传日期时间等信息进行分析,具体流程如下:
1 数据爬取
2 数据清洗
3 数据分析
3.1 重新定义RFM
3.2 定义RFM打分标准
3.3 归一化打分
3.4 计算RFM均值
3.5 用户分类
3.6 统计与可视化
4 运营策略
1 数据爬取
import requests
from bs4 import BeautifulSoup
import numpy as np
import pandas as pd
import warnings
warnings.filterwarnings('ignore')
#获取十个网页网址
url_lst=[]
for i in range(1,11):
urli='http://www.minicap.com/works?page='+str(i)
url_lst.append(urli)
print(url_lst)
#获取十个网页共240个作品的网址
word_lst = []
n = 1
for url in url_lst:
ri = requests.get(url)
soupi = BeautifulSoup(ri.text,'lxml')
info=soupi.find('div',class_='list_det').find('ul').find_all('li',class_='zp_list')
for i in info:
urli=' http://www.minicap.com'+i.find('a')['href']
word_lst.append(urli)
print('成功获取第%i条网址'%n)
n+=1
print(word_lst)
#获取240个作品的相关信息
def get_data(url):
ri=requests.get(url=url)
soupi=BeautifulSoup(ri.text,'lxml')
dic = {}
dic['num']=soupi.find('div',class_='news_l news_det_l').find('div',class_='det_cont sw').find('div',class_='det_fx').find('div',class_='fxr').find('div',class_='det').find('p',class_='p1 dls').text[3:]
dic['author']=soupi.find('div',class_='news_l news_det_l').find('div',class_='det_cont sw').find('div',class_='det_fx').find('div',class_='fxr').find('div',class_='det').find('p',class_='p2 dls').text.split(' ')[0][3:]
info=soupi.find('div',class_='news_l news_det_l').find('div',class_='det_cont sw').find('div',class_='det_fx').find('div',class_='fxr').find('div',class_='det').find('p',class_='p3 dls').text.split(' ')
for i in info[:]:
if ''in info:
info.remove('')
if '\n' in info:
info.remove('\n')
dic['date']=info[0]
dic['time']=info[1]
dic['integral']=soupi.find('div',class_='news_l news_det_l').find('div',class_='det_cont sw').find('div',class_='det_fx').find('div',class_='fx').find('div',class_='ndjj').find('span',class_='jj').text.replace(' ','')[3:]
dic['like_num']=soupi.find('div',class_='news_l news_det_l').find('div',class_='det_cont sw').find('div',class_='det_fx').find('div',class_='fx').find('div',class_='ndjj').find('div',class_='dz_box').find('span',class_='dz_num').text
return dic
info_list = []
n=1
for url in word_lst:
info_list.append(get_data(url))
print('成功获取第%i个网址的基本信息'%n)
n+=1
2 数据清洗
#数据清洗
df=pd.DataFrame(info_list)
for i in range(len(df)):
df['author'][i]=df['author'][i].split('\n')[0]
df['like_num'][i]=df['like_num'][i].split('\n')[1]
print(df)
#查看数据维度和结构
print(df.dtypes)
print('-----------------')
print(df.info())
#修改数据类型
df['integral']=df['integral'].astype(int)
df['like_num']=df['like_num'].astype(int)
df['date']=pd.to_datetime(df['date'])
print(df.dtypes)
#数据保存
df.to_excel(r'C:\Users\Lenovo\Desktop\小瓶盖数据.xlsx')
3 数据分析
3.1 重新定义RFM
由于获取的是作品相关信息(获取信息有限),所以在此对RFM进行重新定义:
R:最近一次上传作品日期据今天几天;
F:作品数(用户最近一段时间内上传作品的数量);
M:点赞数(用户最近一段时间内上传作品的点赞总数)
3.2 定义RFM打分标准
3.3 归一化打分
3.4 计算RFM均值
3.5 用户分类
将3.3与3.4比较得出用户分类
3.6 统计与可视化
4 运营策略
以上便是此次操作全过程,不当之处,还请指正,谢谢!