本文转自:https://blog.csdn.net/varyall/article/details/81173326
如今在银行、消费金融公司等各种贷款业务机构,普遍使用信用评分,对客户实行打分制,以期对客户有一个优质与否的评判。信用评分卡多分为A,B,C卡三类:
其评分机制的区别在于:
信用评分是指根据银行客户的各种历史信用资料,利用一定的信用评分模型,得到不同等级的信用分数,根据客户的信用分数,授信者可以通过分析客户按时还款的可能性,据此决定是否给予授信以及授信的额度和利率。
虽然授信者通过人工分析客户的历史信用资料,同样可以得到这样的分析结果,但利用信用评分却更加快速、更加客观、更具有一致性。
(1) 信审人员对申请人所提交申请资料真实性的认定基本依赖于受理申请资料的信贷业务员的职业操守和业务素质,审批人员对申请人资料的核实手段基本依赖于电话核查,对申请核准与否基本依赖于自己的信审业务经验,授信审查成本高、效率低而又面临很大的欺诈风险,这种状况很难应对年末所谓的“行业旺季”中大规模集中的小额贷款业务需要。
(2) 审批决策容易受主观因素影响、审批结果不一致,审批政策调控能力相对薄弱。
(3) 不利于量化风险级别,无法进行风险分级管理,影响风险控制的能力及灵活度,难以在风险与市场之间寻求合适的平衡点。
(4) 审批效率还有较大提升空间。
信用评分模型的类型较多,比较常使用的3个如下:
信用评分模型开发流程包括模型的设计与规划、样本的选择、预测变量的选择和确定、模型的制定、模型效果的评估和检验、模型的实施、模型表现的跟踪和监控等。
开发目标:
1、确保决策的一致性,减少人工干预,提高信贷政策的执行力;
2、准确反映并量化客户的风险级别,用科学的方法管理风险以控制和减少信贷损失;
3、提高市场竞争能力,在控制可接受的风险水平的同时争取更多优质客户,有效地提高市场占有率;
4、实现审批流程自动化,减少运营成本。
模型建立方法:建立模型可采用的方法很多,业内通常使用逻辑回归方法建立贷款申请评分模型。
好、坏客户定义:好、坏客户的定义必须与银行总体政策、管理目标一致,综合考虑风控策略、催收策略、业务历史、样本数量的需要,如定义曾经有90天以上逾期不良记录的客户为坏客户;定义满12个月,未出现90天以上逾期记录的客户为好客户。
数据来源:内部信用卡核心系统数据库和其它相关业务系统;
样本总数量:选取某地区从2014年1月开始2016年6月的所有申请人,总数120,000人(包括好、坏客户及拒绝的申请客户);
样本空间:
1、坏客户样本空间:2014年8月至2016年2月之间开户的客户;
2、好客户样本空间:2014年6月至2015年5月之间开户的客户;
3、被拒绝客户样本空间:2015年7月至2016年6月之间申请被拒绝的客户。
这一步是开发申请评分模型中最重要、最耗时的步骤之一。数据质量好坏是决定开发的模型成功的关键因素。在确定数据来源后,由于需要采集的数据资料来源不一,数据量大,抽取时耗时较多,就需要在原始数据的基础上,根据业务需求、数据性质、结构及内在逻辑,对数据进行归类、合并、分组,最终建立数据集(或数据仓库)。
数据经过整理后下一步进行数据资料的分析,找出其内在关联性,并经过对样本变量的分组、合并和转换,选择符合建模条件、具有较强预测能力的变量。
如果是连续变量,就是要寻找合适的切割点把变量分为几个区间段以使其具有最强的预测能力。例如客户年龄就是连续变量,在这一步就是要研究分成几组、每组切割点在哪里预测能力是最强的。这一步是评分模型非常重要也是最耗费时间的步骤。如果是离散变量,每个变量值都有一定的预测能力,但是考虑到可能几个变量值有相近的预测能力,因此分组就是不可避免而且十分必要的。
通过对变量的分割、分组和合并转换,最终剔除掉预测能力较弱的变量,筛选出符合小额贷款实际业务需求、具有较强预测能力的变量,使建立的模型更加有效。
利用上面分组后形成的最新数据集进行逻辑回归运算得到初始回归模型。在回归模型的基础上,通过概率与分数之间的转换算法把概率转换成分数进而得到初始评分卡。下一步要将初始评分卡经过拒绝推论,所谓拒绝推论,即申请被拒绝的客户数据未纳入评分系统,导致样本选取的非随机性,整体信用情况因此被扭曲,信用评分模型的有效性降低。
因为申请风险评分模型是用来评估未来所有借款申请人的信用,其样本必须代表所有的借款申请群体,而不仅代表信用质量较好、被批准的那部分客户的信用状况,所以样本必须包括历史上申请被拒绝的申请人,否则,样本空间本身就会出现系统性偏差。因为样本排除了较高信用风险的申请人群体(即历史上申请被拒绝的客户)。如果仅仅依靠被批准申请人群体的样本开发评分模型,并将其运用到整个申请人群体中去,而被批准和被拒绝群体的行为特征和“坏”的比例往往大相径庭,那么这种以被批准群体代表被拒绝群体的做法将必然在很大程度上弱化模型的预测精度。
进行拒绝推论时,由于这部分被拒绝申请人的好坏表现是不可知的,必须以一定的统计手段来推测。推测的方法有很多,可以利用初始评分卡对这部分被拒绝客户进行评分,从而得出每个被拒绝客户如果被审批成为好客户的概率和坏客户的概率,再按其权重放入模型样本中,这样会尽量减少样本的偏差,同时兼顾拒绝样本的不确定性。我们利用拒绝推论后形成的样本(包括核准和拒绝的)重新对每个变量进行分组,其原理和方法与初始分组相同。然后对第二次分组形成的数据集建立逻辑回归模型。最后在第二次回归模型的基础上,通过概率与分数之间的转换算法把概率转换成分数,进而得到最终评分卡。
模型建立后,需要对模型的预测能力、稳定性进行检验后才能运用到实际业务中去。申请评分模型的检验方法和标准通常有:交换曲线、K-S指标、Gini数、AR值等。一般来说,如果模型的K-S值达到30%,则该模型是有效的,超过30%以上则模型区分度越高,本例中模型的K-S值达到40%以上,已经可以上线使用。
模型实施后,要建立多种报表对模型的有效性、稳定性进行监测,如:稳定性监控报表,比较新申请客户与开发样本客户的分值分布,监控模型有效性;特征分析报表,比较当前和开发期间的每个记分卡特征的分布,监控模型有效性;不良贷款分析报表,评估不同分数段的不良贷款,并且与开发时的预测进行比较,监控客户信贷质量;最后分值分析报表,分析不同分数段的申请人、批准/拒绝以及分数调整的客户分布,监控政策执行情况等。
另外,随着时间的推移,申请评分卡的预测力会减弱,因为经济环境、市场状况和申请者、持卡者的构成在不断变化,同时,银行整体策略和信贷政策的变化也要求评分模型适时调整,所以,申请评分卡在建立后需要持续监控,在应用一段时间(一般2-3年)以后必须适当重新调整或重建。
评分卡的发展必须以历史数据为依据,如果公司开展小贷业务的历史太短,数据不充分,则不具备开发评分卡的条件。
如果数据很少,不具有代表性或数据质量很差,有很多错误,那么基于该数据的评分卡就不会准确,那么申请评分卡的发展就会受到制约。
小贷公司必须把历史上各个时期申请贷款的客户申请表信息、当时的信用报告记录等数据保存起来,不仅所有被批准的客户的数据要保存,被拒绝的申请者数据也应该保存,以进行模型的表现推测。而且,保存的数据不仅要足以提炼出各种预测变量,还要能够辨别其表现(好、坏等)。
信用评分卡并不能告诉审批人员某个客户一定是好的或坏的,它只是告诉我们一定的概率,因此,对于有些客户的申请审批决定就必须综合信用报告等其它信息作出判断。
由于爱投在外地其他省份还有好几家分公司,存在着较大的地域差别,各地区经济发展也存在着较大差别,客户消费习惯有较大差异,如果使用一张申请评分卡就会造成信用评分的不真实。
因为经济环境、市场状况和申请者、借款人的构成、业务的来源渠道在不断变化,使得样本人群的特质和属性发生改变,特别是在经济高速发展的阶段(或是股市大牛市阶段),人群的生活方式、消费习惯、经济状况等变化很快,申请评分模型在应用一段时间后通常会与初期模型产生偏移,所以需要适当重新调整,必要时还要重新开发,以保证信用评分卡的有效性。