基于Python的信用评分卡建模分析

1.背景介绍

信用评分技术是一种应用统计模型,其作用是对贷款申请人(信用卡申请人)做风险评估分值的方法。信用评分卡模型是一种成熟的预测方法,尤其在信用风险评估以及金融风险控制领域更是得到了比较广泛的使用。
信用评分卡可以根据客户提供的资料、客户的历史数据、第三方平台(芝麻分、京东、微信等)的数据,对客户的信用进行评估。信用评分卡的建立是以对大量数据的统计分析结果为基础,具有较高的准确性和可靠性。
本文通过对Kaggle上的 Give Me Some Credit (附:Give me some cridets_百度网盘 提取码: tc43)数据的挖掘分析,结合信用评分卡的建立原理,完成了数据处理、特征变量选择、变量WOE编码离散化、logistic回归模型开发评估、信用评分卡和自动评分系统创建等,为金融放款机构等的风险水平控制给予了参考。

2.数据处理

2.1数据说明

数据来源于Kaggle的Give Me Some Credit竞赛项目,其中cs-training.csv文件有15万条的样本数据,包含了11个变量,大致情况如下表所示。
基于Python的信用评分卡建模分析_第1张图片

2.2 准备工作

用jupyter notebook处理数据,需要先做一些准备,需先把一些必要的数据分

你可能感兴趣的:(基于Python的信用评分卡建模分析)