实战5:基于逻辑回归、SVM 等算法预测用户信用评分 代码+数据

1.案例概述

  • 任务描述:信用评分卡模型在信用风险评估及金融风控领域得到广泛的应用,是一种以分数的形式来对用户进行评估的方法,通常评分越高代表用户的信用越好,从而风险也就越小。常见的信用评分卡有:A卡(申请评分卡)、B卡(行为评分卡)、C卡(催收评分卡)等,三者分别侧重贷前、贷中、贷后三个阶段,具体含义如引用所示。本案例选用的数据集主要涉及借款人的行为评级,因此任务是建立行为评分卡模型,该评分卡可以根据借款人在借贷之后的行为表现,预测其未来违约的概率。

  • 数据集:本案例所用数据来自Kaggle平台的 Give Me Some Credit比赛,该赛事提供了15万条用户样本,每条样本包含12列属性,分别从还款率、额度使用率、历史逾期特征、借款人信息等不同维度出发对用户进行刻画,数据集可以从基于逻辑回归完成信用评分卡建模任务.zip_adaboost回归算法代码实现-机器学习文档类资源-CSDN下载下载。该赛题原本的任务是根据用户的行为特征等预测用户在未来出现“90天或更长时间的逾期行为”的概率,而本案例旨在采用该数据集构建用户的信用评分卡,相对原赛题略有不同,是一个在模型预测之后生成评分卡的过程,可以说是原任务的延伸。

  • 运行环境:在Python3.6环境下测试了本教程代码。需要的第三方模块包括:

    <

你可能感兴趣的:(机器学习实战100例,python,开发语言,算法,数据挖掘)