数据挖掘练习——电信客户流失预警项目

一、主题:

客户流失问题是电信运营面临的一项重要的项目,根据经验,开发新的客户源比保留既有客户的开销大的多(uaually存在5-20倍的差距)。因此,如何根据历史数据保留住原有客户是一件非常重要的事情。

二、一般数据分析,挖掘基本步骤:

1、用pandas导入数据,查看数据的基本情况

2、探索性数据分析(EDA):单变量可视化;双变量的关系;多变量的关系

3、特征工程

特征筛选:

将一些object类型改成数值类型;

增加或者删除一些列

特征工程:

通过Scale去量纲的影响

4、应用机器学习算法(分类,回归,聚类等):此例子中以分类为例子,根据历史数据,由机器学习算法去预测某客户是否会流失。

5、模型调参、提升模型


三、下面是关于本次挖掘项目——客户流失预警

环境:Jupyter Notebook




用热力图看前10个相关度最高的特征:

查看此三列关系



合并列

删除没必要的列



用10+种模型建模:

写在最后:很开心自己磕磕绊绊快一年了,还是始终在坚持学习自己喜欢的东西,今天这个小案例的输出,为了总结反馈自己这么久以来的学习成果。也希望将机器学习的预测应用到实际的项目中去。

不足:由于时间准备得比较仓促,有很多细节没有详细说明,请见谅~ 多多指教!

你可能感兴趣的:(数据挖掘练习——电信客户流失预警项目)