信用评分卡模型(A/B/C)

https://blog.csdn.net/varyall/article/details/81173326

A卡(Application score card)申请评分卡

B卡(Behavior score card)行为评分卡

C卡(Collection score card)催收评分卡

使用时间不同,分别侧重于贷前、贷中、贷后。

数据要求不同

A卡:一般可做0-1年的信用分析

B卡:申请人有了一定的行为后,有了较大数据进行的分析,一般为3-5年。

C卡:需加入催收后客户反应等属性数据。

每种评分卡模型会不一样

       A卡中常用的有逻辑回归,AHP等。

       后两种中常使用多因素逻辑回归,精度等方面更好。

信用评分模型的简介

信用评分的类型较多,比较常使用的3个如下:

(1)在客户获取期,建立信用风险评分模型,预测客户带来违约风险的概率大小;

(2)在客户申请处理期,建立申请风险评分模型,预测客户开户后一定时期内违约拖欠的风险概率,有效排除了信用不良客户和非目标客户的申请;

(3)在账户管理期,建立催收评分模型,对逾期账户预测催收策略反应的概率,从而采取相应的催收措施。

信用评分卡的开发

信用评分模型开发流程包括模型的设计与规划、样本的选择、预测变量的选择和确定、模型的制定、模型效果的评估和检验、模型的实施、模型表现的跟踪和监控等。

(1)建立开发目标、方法及业务问题的定义

开发目标:

1、确保决策的一致性,减少人工干预,提高信贷政策的执行力;

2、准确反映并量化客户的风险级别,用科学的方法管理风险以控制和减少信贷的损失;

3、提高市场竞争能力,在控制可接受的风险水平的同时争取更多优质客户,有效提高市场占有率;

4、实现审批流程自动化,减少运营成本。

模型建立方法:建立模型可采用的方法很多,业内通常使用逻辑回归方法建立贷款申请评分模型。

好、坏客户定义:好、坏客户的定义必须与银行总体政策、管理目标一致,综合考虑风控策略、催收策略、业务历史、样本数量的需要,如定义曾经有90天以上逾期不良记录的客户为坏客户;定义满12个月,为出现90天以上逾期记录的客户为好客户。

(2)确定数据源,选取样本

数据来源:内部信用卡核心系统数据库和其他相关业务系统;

数据总数量:选取某地区从2014年1月开始2016年6月的所有申请人,总数120000人(包括好、坏客户及拒绝的申请客户);

样本空间:
       1、 坏客户样本空间:2014年8月至2016年2月之间开户的客户;

       2、好客户样本空间:2014年6月至2015年5月之间开户的客户;

       3、被拒绝客户样本空间:2015年7月至2016年6月之间申请被拒绝的客户。

(3)数据抽取、清理和整理,建立数据集

这一步是开发申请模型中最重要、最耗时的步骤之一。数据质量好坏是决定开发的模型成功的关键因素。在确定数据来源后,由于需要采集的数据资料来源不一,数据量大,抽取时耗时较多,就需要再原始数据的基础上,根据业务需求、数据性质、结构及内在逻辑,对数据进行归类,合并、分组,最终建立数据集(或数据仓库)。

(4)数据分析、变量选择及转换

数据经过整理后下一步进行数据资料的分析,找出其内在关联性,并经过对样本变量的分组、合并和转换,选择符合建模条件、具有较强预测能力的变量。

如果是连续变量,就是要寻找合适的切割点把变量分为几个区间段以使其具有较强的预测能力。例如客户的年龄就是连续变量,在这一步就是要研究分成几组、每组切割点在哪里预测能力是最强的。这一步是评分模型非常重要也是耗费时间的步骤。如果是离散变量,每个变量值都有一定的预测能力,但是考虑到可能有几个变量值有相近的预测能力,因此分组就是不可避免而且十分必要的。

通过对变量的分割、分组和合并转换,最终剔除掉预测能力较弱的变量,筛选出符合小额贷款实际业务需求、具有较强预测能力的变量,使建立的模型更加有效。

(5)创建评分模型

利用上面分组后形成的最新数据集进行逻辑回归运算得到初始回归模型。在回归模型的基础上,通过概率与分数之间的转换算法把概率转换成分数进而得到初始评分卡。下一步要将初始评分卡经过拒绝推论,所谓拒绝退推论,即申请被拒绝的客户数据未纳入评分系统,导致样本选择的非随机性,整体信用情况因此被扭曲,信用评分面模型的有效性降低。

因为申请风险评分模型是用来评估未来所有借款申请人的信用,其样本必须代表所有的借款申请人群体,而不仅代表信用质量较好、被批准的那部分客户的信用状况,所以样本排除了较高信用风险的申请人群体(即历史上申请被拒绝的客户)。如果仅仅依靠被批准申请人群体的样本开发评分模型,并将其运用到整个申请人群体中去,而被批准和被拒绝群体的行为特征和‘坏’的比例往往大相径庭,那么这种以被批准群体代表被拒绝的群体的做法将必然在很大程度上弱化模型的预测精度。

进行拒绝推论时,由于这部分被拒绝申请人的好坏表现是不可知的,必须以一定的统计手段来推测。推测的方法有很多,可以利用初始评分卡对这部分被拒绝客户进行评分,从而得出每个被拒绝客户如果被审批成为好客户的概率和坏客户的概率,再按其权重放入模型样本中,这样会尽量减少样本的偏差,同时兼顾拒绝样本的不确定性。我们利用拒绝推论后形成的样本(包括核准和拒绝的)重新对每个变量进行分组,其原理和方法与初始分组相同。然后对第二次分组形成的数据集建立逻辑回归模型。最后在第二次回归模型的基础上,通过概率与分数之间的转换算法把概率转换成分数,进而得到最终评分卡。

(6)模型检验

模型建立后,需要对模型的预测能力、稳定性进行检验后才能运用到实际业务中去。申请评分模型的检验方法和标准通常有:交换曲线、K-S指标、Gini数、AR值等。一般来说,如果模型的K-S值达到30%,则该模型是有效的,超过30%以上则模型区分度越高,本例中模型的K-S值达到40%以上,已经可以上线使用。

========================================================================================

分析流程-A卡

1) 数据读取:训练集、测试集

2)探索性分析EDA:变量分布情况-中位数、均值等。

3)数据预处理:缺失值处理、异常值处理、特征相关性分析

4)特征选择:变量离散化、WOE变化

5)模型开发:逻辑回归

6)模型评估:K-S指标、拟合度曲线

7)信用评分:好坏比、基础分值等创立标准评分卡

8)对测试集进行预测和转换为信用评分卡

 

 

你可能感兴趣的:(信用评分卡模型(A/B/C))