Python数分析实战2--航空公司客户价值分析

文章首发于公众号:1024程序开发者社区

0.引言

本文是在学习《Python数据分析与挖掘实战》时的一个记录,文中代码可点击下载,对书中部分代码进行改动以适应新版本。同时感谢https://github.com/apachecn/python_data_analysis_and_mining_action前辈无私分享的资料。

1.问题提出与建模

航空公司对于根据以往客户乘机数据,将用户分类,对每种用户特点进行有针对的服务。
应用比较通用的为LRFMC模型,对所获得数据进行指标提取,获得所需数据,具体数据清洗,标准化参照书中模型。


指标含义.PNG

建模流程为:


Python数分析实战2--航空公司客户价值分析_第1张图片
建模流程.PNG

这在其他问题的建模中也可以借鉴。

2.聚类分析

处理后的数据样式为:


Python数分析实战2--航空公司客户价值分析_第2张图片
训练数据.PNG

其中ZL可以理解为入会时间,ZR最近一次坐飞机多久了,ZF累计飞了多少次,ZM累计飞了多远,ZC为所有消费的平均折扣。
调用KMeans方法对特征数据进行聚类,代码为:

import pandas as pd
from sklearn.cluster import KMeans

k = 5
data = pd.read_excel('zscoreddata.xls')
cluster_centers = 'cluster_centers.xls'

kmodel = KMeans(n_clusters=k,n_jobs=4)#n_jobs并行数,一般等于cpu数
kmodel.fit(data)

print(kmodel.cluster_centers_)#输出聚类中心点
center = kmodel.cluster_centers_
center = pd.DataFrame(center)
center.to_excel(cluster_centers, index=False)

print(kmodel.labels_)#输出每个客户的标签
labels =kmodel.labels_
labels = pd.DataFrame(labels)
labels.to_excel('zscoreddatanew.xls', index=False)

输出结果为:


Python数分析实战2--航空公司客户价值分析_第3张图片
聚类中心点.png
Python数分析实战2--航空公司客户价值分析_第4张图片
用户分布.png

关注即送海量学习资源:


Python数分析实战2--航空公司客户价值分析_第5张图片
7. We can see you Anonmous.png

你可能感兴趣的:(Python数分析实战2--航空公司客户价值分析)