基于RFM的航空公司客户价值分析模型

目录

一、背景

二、分析方法与过程

2.1数据抽取

2.2 数据探索分析

2.3 数据预处理

2.3.1 数据清洗

2.3.2 属性规约

2.3.3 数据变换

2.4 聚类分析

2.5特征分析

三、分析结果

四、模型应用

4.1会员的升级与保级

4.2首次兑换

4.3交叉销售

参考资料


一、背景

面对激烈的市场竞争,各个航空公司都推出了更优惠的营销方式来吸引更多的客户,国内某航空公司面临着客户流失、竞争力下降和航空资源未充分利用等经营危机。通过建立合理的客户价值评估模型,对客户进行分群,分析比较不同客户群的客户价值,并制定相应的营销策略,对不同的客户群提供个性化的服务是必须和必要的。目前该航空公司已积累了大量的会员档案信息和其乘坐航班积累,经加工后得到下图所示的部分数据属性定义信息。

基于RFM的航空公司客户价值分析模型_第1张图片

 

 

需要根据这些数据实现以下目标。

  1. 对客户进行分类。
  2. 对不同的客户类别进行特征分析,比较不同类别客户的客户价值。

二、分析方法与过程

在客户分类中,RFM模型是一个经典的分类模型,模型利用通用交易环节中最核心的三个维度——最近消费(Recency)、消费频率(Frequency)、消费金额(Monetary)细分客户群体,从而分析不同群体的客户价值。在某些商业形态中,客户与企业产生连接的核心指标会因产品特性而改变。如互联网产品中,以上三项指标可以相应地变为下图中的三项:最近一次登录、登录频率、在线时长。

基于RFM的航空公司客户价值分析模型_第2张图片

 

我们说RFM模型由R(最近消费时间间隔)、F(消费频次)和M(消费总额)三个指标构成,通过该模型识别出高价值客户。但该模型并不完全适合所有行业,如航空行业,直接使用M指标并不能反映客户的真实价值,因为“长途低等舱”可能没有“短途高等舱”价值高。考虑到商用航空行业与一般商业形态的不同,决定在RFM模型的基础上,增加2个指标用于客户分群与价值分析,得到航空行业的LRFMC模型:

  1. L:客户关系长度。客户加入会员的日期至观测窗口结束日期的间隔。(反映可能的活跃时长)
  2. R:最近一次乘机时间。最近一次乘机日期至观测窗口结束日期的间隔。(反映当前的活跃状态)
  3. F:乘机频率。客户在观测窗口期内乘坐飞机的次数。(反映客户的忠诚度)
  4. M:飞行总里程。客户在观测窗口期内的飞行总里程。(反映客户对乘机的依赖性)
  5. C:平均折扣率。客户在观测窗口期内的平均折扣率。(舱位等级对应的折扣系数,侧面反映客户价值高低)

2.1数据抽取

以2014-03-31为结束时间,选取宽度为两年的时间段作为分析观测窗口,抽取观测窗口内所有客户的详细数据形成历史数据。对于后续薪资的客户详细信息,以后续薪资数据中最新的时间点作为结束时间,采用同样的方法进行抽取,形成增量数据。

根据末次飞行日期(LAST_FLIGHT_DATE),抽取2012-04-01日至2014-03-31期间的所有客户数据,共有6万余条记录44个属性。

2.2 数据探索分析

本案例的探索分析是对数据进行缺失值分析与异常值分析。通过观察数据发现存在票价为空值,票价最小值为0、折扣率最小值为0、总飞行公里数大于0的记录。票价为空值的数据可能是客户不存在乘机记录造成,其他的数据可能是客户乘坐0折机票或者积分兑换产生的。

过初步的数据探索,发现数据有几点特征:

1、共62988条记录

2、部分维度存在缺失值,WORK_CITY缺失2269条,SUM_YR_1缺失551条,SUM_YR_2缺失138条

2.3 数据预处理

本案例主要采用数据清洗、属性规约与数据变换的预处理方法。

2.3.1 数据清洗

通过数据探索分析,发现数据总存在缺失值,票价最小值为0、折扣率最小值为0、总飞行公里数大于0的记录。由于原始数据量大,这类数据占比较小,因此对其进行丢弃处理。

1、缺失值:票价为null的数据(注意不是票价为零)

2、异常值:票价为0、平均折扣率不为0、总飞行公里数大于0的数据(折扣不为0,仍有飞行里程,说明客户必然是花钱买票飞行的,如果此时票价也为0,说明是错误数据)

共清洗944条异常数据,得到62044条有效记录。

2.3.2 属性规约

根据航空公司客户LRFMC模型,选择与LRFMC模型指标相关的6个属性:FFP_DATE、LOAD_TIME、FLIGHT_COUNT、AVG_DISCOUNT、SEG_KM_SUM、LAST_TO_END。

2.3.3 数据变换

本案例中采用的数据变换方式为属性构造和数据标准化。

LRFMC模型中五项指标的计算公式:

(1)L = LOAD_TIME – FFP_DATE. (观测窗口结束日期 – 入会日期)

(2)R = LAST_TO_END. (最后一次乘机时间至观测窗口结束时长)

(3)F = FLIGHT_COUNT. (观测窗口内的飞行次数)

(4)M = SEG_KM_SUM. (观测窗口的总飞行公里数)

(5)C = AVG_DISCOUNT. (平均折扣率)

对每个指标数据的分布情况进行分析,发现每个指标的数据取值范围分布较广,为消除数量级数据带来的影响,还需要将L、R、F、M、C五类数据进行标准化处理。标准化方法有极大极小标准化、标准差标准化等方法,此处采用标准差标准化的方法对数据进行处理。

2.4 聚类分析

根据5个指标的数据对客户进行聚类分群,利用K-Means算法对客户进行聚类分析,聚类结果如下图所示。

基于RFM的航空公司客户价值分析模型_第3张图片

注:a. 由于K-Means聚类是随机选择类标号,因此重复实验结果中类标号可能与此不同;

b. 由于算法精度问题,重复实验得到的聚类中心也可能略有不同;

c. 需要结合业务理解与分析来确定客户的类别数量,此次选择5个类别。

2.5特征分析

结合业务对每个客户群进行特征分析,分析客户价值。

基于RFM的航空公司客户价值分析模型_第4张图片

 

1、对细分的客户群进行特征分析:

群体1的C属性上最大

群体2的M、F属性属性最大,R属性最小

群体3的L、C属性最小

群体4的R属性最大,F、M属性最小

群体5的L属性最大

2、其中每项指标的实际业务意义为:

L:加入会员的时长。越大代表会员资历越久

R:最近一次乘机时间。越大代表越久没乘机

F:乘机次数。越大代表乘机次数越多

M:飞行总里程。越大代表总里程越多

C:平均折扣率。越大代表折扣越弱,0表示0折免费机票,10代表无折机票

 

3、对应实际业务对聚类结果进行分值离散转化,对应1-5分,其中属性值越大,分数越高。

基于RFM的航空公司客户价值分析模型_第5张图片

 

4、结合业务需要,参考RFM模型对客户类别的分类,定义五个等级的客户类别。指标大于平均值表示为↑,小于平均值表示为↓。

(1)重要保持客户

  1. 平均折扣率高(C↑),最近有乘机记录(R↓),乘机次数高(F↑)或飞行里程高(M↑),入会时间长(L↑)。
  2. 这类客户机票票价高,不在意机票折扣,经常乘机,是最理想的高价值客户,但所占比例比较小。
  1. 公司应优先将资源投放到他们身上,维持这类客户的忠诚度与满意度,尽可能延长这类客户的高消费水平。

(2)重要发展客户

  1. 平均折扣率高(C↑),最近有乘机记录(R↓),但乘机次数低(F↓)或飞行里程低(M↓),入会时间短(L↓)。
  2. 这类客户机票票价高,不在意机票折扣,最近有乘机记录,但总里程低,人如何时间短,是潜在价值客户。虽然当前价值不是很高,但有很大的发展潜力。
  3. 通过客户价值的提升,加强这类客户的满意度,提高他们转向竞争对手的转移成本,使他们逐渐成为忠诚客户。

(3)重要挽留客户

  1. 平均折扣率高(C↑),最近无乘机记录(R↑),乘机次数高(F↑)或里程高(M↑),入会时间长(L↑)。
  2. 这类客户入会时间长,总里程高,但最近无乘机记录,可能处于流失状态。
  3. 由于这类客户价值变化的不确定性很高,衰退原因各不相同,所以掌握客户的最新信息、维持与客户的互动尤为重要。航空公司应采取一定的营销手段防范客户流失,延长客户的生命周期。

(4)一般客户

  1. 平均折扣率低(C↓),最近无乘机记录(R↑),乘机次数低(F↓)或飞行里程低(M↓),入会时间短(L↓)。
  2. 这类客户机票票价低,经常买折扣机票,飞行频次低,最近无乘机记录,可能是趁着折扣而选择购买。
  3. 公司需要在资源支持的情况下强化对这类客户的联系,进行一些交叉销售。

(5)低价值客户

  1. 平均折扣率低(C↓),最近无乘机记录(R↑),乘机次数低(F↓)或飞行里程低(M↓),入会时间短(L↓)。
  2. 这类客户入会时间短,属于新客户,多选择折扣票,飞行里程低,最近有乘机记录,可能是趁着折扣而选择购买,对品牌无忠诚度。

其中,重要发展客户、重要保持客户、重要挽留客户这三类重要客户可以分别归入客户生命周期管理的发展期、稳定期、衰退期三个阶段。

根据每种客户类型的特征,对各类客户群进行客户价值排名。针对不同类型的客户群提供不同的产品和服务,提升重要发展客户的价值、稳定和延长重要客户的高消费水平、防范重要挽留客户的流失并积极进行关系恢复。

基于RFM的航空公司客户价值分析模型_第6张图片

 

三、分析结果

根据建模结果,发现该公司的五类不同价值的客户数量分布如图所示:

基于RFM的航空公司客户价值分析模型_第7张图片

 

重要保持客户、重要发展客户占比15.3%,不足两成,整体较少

一般客户、低价值客户占比59.3%,接近六成,整体偏多

重要挽留客户占比25.4%,接近四分之一,整体发挥空间大

按照20/80法则:一般而言企业的80%收入由头部20%的用户贡献。从上图中也能发现:忠诚的重要保留客户、中发展客户必然贡献了企业收入的绝大部分,企业也需要投入资源服务好这部分客户。

一般而言,数据分析最终的目的是针对分析结果提出并开展一系列的运营/营销策略,以期帮助企业发展。在本实例中,运营策略有三个方向:

提高活跃度:提高一般客户、低价值客户的活跃度。将其转化为优质客户

提高留存率:与重要挽留客户互动,提高这部分用户的留存率

提高付费率:维系重要保持客户、重要发展客户的忠诚度,保持企业良好收入

四、模型应用

根据对各个客户群进行特征分析,采取下面的一些营销手段和策略,为航空公司的价值客户群管理提供参考。

4.1会员的升级与保级

航空公司的会员一般分为白金卡会员、金卡会员、银卡会员、普通卡会员,非普通卡会员可以统称为精英会员,不同航公司的会员制管理方法大同小异。成为精英会员一般要求在一定时间内积累一定的飞行里程或航段,达到这种要求后就会在有效期内成为精英会员,并享受相应的高级版服务。在有效期快结束时,根据相关评价方法确定客户是否有资格继续做为精英会员,然后对该客户进行相应的升级或降级。

然而,由于许多客户并没有意识到或不太了解会员升级或保级的时间与要求(相关的文件说明往往复杂且不易理解),经常在评价期过后才发现自己其实只差一点就可以实现升级或保级,错失了机会而使之前的里程积累白白损失。同时,这种认知可能导致客户的不满而放弃在本公司的消费。

因此,航空公司可以在对会员升级或保级进行评价的时间点之前,对那些尚未达到要求的较高消费客户进行适当提醒或者采取一些促销活动,刺激他们达到相应标准。这样既可以获得收益同事也提高了客户的满意度。

4.2首次兑换

客户可以通过消费积累的里程来兑换免票或免费升舱等,但很多航空公司的里程累积会随着时间进行一定的削减,例如有的公司会在年末对该年积累的里程进行折半处理。这样会导致许多不了解情况的会员损失自己积累的里程,甚至总是难以实现首次兑换,同样也会引起客户的不满或流失。

因此,航空公司可以对这些接近但尚未达到首次兑换标准的会员进行提醒或促销,使他们通过消费达到标准。一旦客户实现了首次兑换,客户在进行消费兑换就比其他公司进行兑换要容易许多,在一定程度上提高了转移成本。

4.3交叉销售

通过发行联名卡等于非航空类企业合作,使客户在其他企业的消费过程中获得公司的积分,增强与公司的联系,提高客户的忠诚度。例如,可以查看重要客户在非航空类合作伙伴处的消费情况,找出客户的行为偏好,对他们进行相应的促销。

 

参考资料

1.《Python数据分析与挖掘实战》第七章及配套数据

2.案例分析:基于RFM的客户价值分析模型

3.实战代码

基于RFM的客户价值分析模型
[Jīyú RFM de kèhù jiàzhí fēnxī móxíng]
RFM customer value analysis model
 

你可能感兴趣的:(数据挖掘,机器学习应用)