个人贷款违约预测模型

1 项目介绍

本项目通利用Kaggle平台predict-loan-defaulters (网盘下载提取码: tkup)贷款数据,通过逻辑回归模型来对这些数据进行预测判断,构建贷款违约预测模型,建立预测模型,预测正处于贷款期间的人的违约的概率 。

业务理解

在贷款管理方面,如果可以通过构建量化模型对客户的信用等级进行一定的区分。得知了每个账户的违约概率后,可以预估一下未来的坏账比例,及时做好资金安排。也可以对违约概可能性较高的客户进行更加频繁的“关怀”,及时发现问题,以避免损失。
在这个量化模型中,被解释变量为二分类变量,因此需要构建一个排序类分类模型。而排序类分类模型中常使用的算法是逻辑回归。

1.2 数据介绍
实际业务中的一个人可以拥有多个账户号(account_id),一个账户号(account_id)可以对应有多个顾客(client_id),即多个顾客共享一个账户号(account_id),但是每个帐户号(account_id)的所有者(即最高权限者)只能是一人。
账户号(account_id)与客户号(client_id)的对应关系,在表“disposition”中进行列示;
表“Loan”为银行提供给账户号(account_id)的服务;
表“Credit card”为银行提供给的顾客(client_id)的服务,每个客户可以申请一张信用卡;
贷款为基于账户的服务,一个账户(account_id)在一个时点最多只能有一笔贷款。
本次数据建模分析共用了八个数据表:
个人贷款违约预测模型_第1张图片

你可能感兴趣的:(个人贷款违约预测模型)