银行客户流失预警模型——业务分析及代码(实战)

DataMiningCase

  

流失预警模型(二分类),代码原型为本人在某银行做的流失模型,AUC:83%、召回率:19.4%,精确率:85%(数据是外部数据/代码已脱敏)

你将习得:数据的处理、LightGBM、sklearn包(里面含有:GridSearchCV寻找最优参、StratifiedKFold分层5折切分、train_test_split单次数据切分等)、画AUC图、画混淆矩阵图,并输出预测名单。

注释覆盖率为80%左右,旨在帮助快速入门,新手级

该项目涉及的如下:

  • 业务理解
    • 业务需求分析(实战)
  • 数据理解
    • 数据质量探查
    • 重要特征探查
  • 数据处理
    • preprocessing函(数据切分成训练用数据X,和校对数据y)
    • dropna(处理异常值字段)
    • pd.value_counts(正负样本情况)
    • fillna(null值填充)
    • smote(过采样)
  • 特征工程
    • corr(特征相关系数图)
    • 正负样本特征柱状图
    • 正负样本特征线性图
    • rfecv(特征五折递归消除)
    • importance(基于模型的特征重要性)
  • 模型训练
    • GridSearchCV(寻找最优参)
    • LightGBM参数详解
    • StratifiedKFold(分层5折模型训练)
    • train_test_split(单次切分模型训练)
    • 输出名单
    • ks值及优threshold
  • 画图
    • plot/auc_plot(画AUC图)
    • confusion_matrix/plot_confusion_matrix(画混淆矩阵图)
  • 模型评估及实验
    • 模板

说明

本专题并不用于商业用途,转载请注明本专题地址,如有侵权,请务必邮件通知作者。

本人水平有限,代码搬到外部环境难免有遗漏错误的地方,望不吝赐教,万分感谢。

有代码疑惑的地方也请找我。

Email:[email protected]

QQ:909336740

 

你可能感兴趣的:(银行客户流失预警模型——业务分析及代码(实战))