11.K-S(klmogrov-smirnov,good与bad最大区分度):这是一个区分度指标,用于评分卡对好坏客户的最大区分度,自KS-PSI指标是用于衡量评分卡之有效度及准确性。所谓区分度,是指模型对于好坏客户的辨识能力,区分力越强,模型准确度越高,误判的几率越低。K-S值越大越好,一般0.6以上用户解释能力很高。好坏样本累计差异越大,KS指标越大,那么模型的风险区分能力越强。
12.PSI(population stability index,稳定度指标):越低越稳定。用于比较当前客群与模型开发样本客群差异程度,评价模型的效果是否符合预期。PSI=SUM((VALID_BAD_P-TRAIN_BAD_P)*LM(VAID_BAD_P/TRAIN_BAD_P/TRAIN_BAD_P))
其实PSI表示的就是按分数分档后,针对不同样本,或者不同时间的样本,population分布是否有变化,就是看各个分数区间内人数占总人数的占比是否有显著变化。
13.WOE(weight of ecidence,证据权数):取值区间(-1,1)。违约件占比高于正常件,WOE为负数。绝对值越高,表名该组因子区分好坏客户的能力越强。WOE=LM(B_P/G_P)。
分箱之后我们便得到了一系列的离散变量,下面需要对变量进行编码,将离散变量转化为连续变量。WOE编码是评分卡模型常用的编码方式。
WOE 称为证据权重(weight of evidence),是一种有监督的编码方式,对于自变量第 i 箱的WOE值为:
WOE表示的实际上是“当前分箱中坏客户占所有坏客户的比例”和“当前分箱中好客户占所有好客户的比例”的差异。
公式变换:
变换后,WOE也可以理解为当前分箱中坏客户和好客户的比值,和所有样本中这个比值的差异 (也就是我们随机的坏客户和好客户的比例)。
·WOE越大,这种差异越大,当前分组里的坏客户的可能性就越大,WOE越小,差异越小,这个分组里的坏客户的可能性就越小。 --但是并不是越小越好0值
·当分箱中坏客户和好客户的比例等于随机坏客户和好客户的比值时,说明这个分箱没有预测能力,即WOE=0
13.Bad capture rate(模型提升度):坏用户捕获率,这是评价模型效果的一个指标,比率越高越好。
14.Lift:表示使用模型比未使用的区分效果提升能力。
15.Population(all population):全体样本用户,包括建模样本与验证样本。
16.ROC(Receiver Operating Characteristic Receiver Operating Characteristic):
真正例率(TPR):真实label为+的样本里,预测为+的样本比例
假正例率(FPR):真实label为-的样本里,预测为+的样本比例
ROC曲线,以FPR为横轴,TPR为纵轴绘制的曲线,横坐标X轴为 1 – 特异性,也称为假阳性率(误报率),X轴越接近零准确率越高;纵坐标Y轴称为敏感度,也称为真阳性率(敏感度),Y轴越大代表准确率越好。
它越靠近左上角,表明模型的性能越好。ROC曲线主要用于X对Y的预测准确率情况。
根据曲线位置,把整个图划分成了两部分,曲线下方部分的面积被称为AUC(Area Under Curve),用来表示预测准确性,AUC值越高,也就是曲线下方面积越大,说明预测准确率越高。曲线越接近左上角(X越小,Y越大),预测准确率越高。
如果模型A的ROC曲线能完全“包住”模型B的ROC曲线,则可断言A的性能比B好。
17.AUC(area under curve):定义为ROC曲线下面积,通常大于0.5小于1.体现模型预测精准度指标之一。
18.GINI(同KS指标):都是体现模型区分能力的指标。
19.AR(accuracy rate,AR=2AUC-1):表征模型的区分能力,同gini指标计算结果一致。
20.Recovery(坏账回收金额):坏账核销后回收的金额。
21.DPD(逾期天数):超过还款日仍未还款的天数。
22.Due day(应还款日):到期还款日。
23.IIP(贷款净损失):总坏账金额-坏账回收金额
24.PIP(拨备计提)
25.New booking(新放款)
26.Booking amount(放款金额)
27.Average loan amount(件均放款金额)
28.Approve rate(批核率):批核案件数/(批核案件数+拒绝案件数)
29.Cancellation rate(退单率):退单案件数/(批核案件数+拒绝案件数+退单案件数)
30.Current(当前未逾期):正常还款且当期未逾期;current-M3等指标是用作检视资产之逾期状况,也用作催收工作之目标。
31.M0(当前未逾期):正常还款且当期未逾期;
32.M1(逾期1-29天):逾期1-29天的户数或放款余额。
33.M2(逾期30-59天):逾期30-59天的户数或放款余额。
34.M3(逾期60-89天):逾期60-89天的户数或放款余额。
35.FPD(首期还款逾期):第一期还款马上逾期,这指标也会用来评估被诈骗之状况,用以放款后首两期即逾期后变为坏账之案件,认定为被诈骗之案件。
36.Flow rate%(转化率):一般指Mn流入Mn+1的比率。
37.Gini(gini系数):用于评分卡对好坏客户的整体区分度。
38.DSR(资产负债率)
39.LI(贷款减值):贷款净损失+拨备计提
40.Vintage(账龄分析):账龄分析是以放款时点为核心的分析、比较不同时点之放款,放款后之表现,用于预测放款之还款表现的工具,主要分析账户成熟期变化规律。
(1)Vintage 分析的作用
①确定资产质量:主要是根据逾期率,在曲线平缓后对应的逾期率;
②分析变化规律:主要是观察逾期率上升下降变化的幅度和快慢;
③确定账户成熟期:判定客户展现好坏的时间因素,进一步帮助定义表现期;
④分析影响因素:分控策略、客群变化、市场环境、政策法规等。
(2)账户表现期
如果客户表现期越长,信用风险就会暴露得越彻底,但在观察期也会离现在越远,提取样本的数据特征陈旧,建模样本与未来样本差异就会越大。相反:表现期短à风险暴露就少à取样的样本就会越近
(3)Vintage图像特征
①最长的账龄(MOB)表现的是产品的期限;
②MOB0,MOB1,MOB2……MOBn 的逾期率都是0的话,那么逾期指标为Mn+1风险(逾期超过30n)的风险;
③不同月份vintage 曲线的上升和下降变化,可以体现资产质量的变化水平,以及揭示相应的原因;
④vintage曲线在n个MOB后趋于稳定,那么账户成熟期就是n个月。
(4)Vintage逾期率(Y轴)计算
①订单口径:逾期率=逾期订单数/总放贷订单数
②金额口径:逾期率=逾期剩余本金/总放贷本金
41.逾期期数(bucket):以逾期的账单期数,M0表示账单日与还款日之间的日期。账单日Mx表示逾期X期。
42.逾期(stage):初期M1、中期M2-M3、长期M3+。
43.即期指标(coincidental):计算延滞率的常用方法,当前各bucket延滞金额除以当期应收账款。反应当期的资产结构。
44.递延指标(lagged):各bucket延滞金额除以上一期应收账款。
45.欺诈损失率:欺诈金额/签约金额
46.命中率:对于评分卡应用的具体指标。例如反欺诈预警命中率。
47.查得率:查的人数/实际查询人数,通常用于衡量三方数据的质量。
48.MOB:
M0:正常资产,无逾期,有时也用C表示
M1:逾期一期,或逾期1-30天
M2:逾期两期,或逾期31-60天
M3:逾期三期,或逾期61-90天
M4:逾期四期,或逾期91-120天
M5:逾期五期,或逾期121-150天
M6:逾期六期,或逾期151-180天
M6+:逾期大于六期,或逾期大于180天。一般逾期大于180天,会进行坏账核销
MOB的最大值指的是信贷产品期限
Eg:MOB0指的是资产放款至月底;MOB1指的是资产放款后第二个完整的月份;MOB2指的是资产放款后第三个完整的月份----如2019.11.13放款,那么MOB0就为2019.11,MOB1为2019.12。
49.迁徙率(flow rate)
(1)迁徙率的作用
①观察发展轨迹、监控坏账发展方向、催收效果;
②多个月份的迁移率平均值,迁移率更加稳定
③是预测未来坏账损失的常用方法
(2)计算公式
Mn—>Mnb+1的迁移率=当月进入Mn+1的贷款余额/上月末Mn的贷款余额
例如M4-M5的迁移率=5月进入的贷款余额/4月的贷款余额
①定义逾期状态;
②计算各逾期状态的迁移率;
③计算不同月份(Vintage)的平均迁移率;
④根据平均迁移率、不良资产回收率,计算净坏账损失率
50.入催率
某个还款日,客户从M0-M1的比例
Eg:N个M0客户到了还款日,M个客户按时还款,入催率=(N-M)/N
入催率应当包含所有到期的M0
51.坏账准备金
计算步骤:
①统计未清偿贷款金额的分布,也就是M0-M6状态分别对应的资产余额;
②为每个逾期状态的资产分配一个准备金比例;
③每个子项目的准备金金额=未清偿贷款余额*准备金比例
④每个子项目的准备金金额相加,得到最终的准备金。
准备金比例的计算:
由于坏账准备金是用来覆盖预期的未来呆账损失的,准备金比例必须等于处于各个逾期状态的资产未来演变为呆账的比例。
正常M0资产对应的毛坏账损失率:
毛坏账损失率=(M0-M1)*(M1-M2)*(M2-M3)*(M3-M4)*(M4-M5)*(M5-M6)*(M6-M7) [也就是各个阶段转化率相乘]
净坏账损失率=毛坏账损失率-不良资产外卖回收率
当月应计拨备额=sum(净坏账损失率*月末应收账款余额)
拨备率=当月应计拨备额/总资产金额
注:拨备率是用来预防不良资产的发生而准备的金额。拨备率应该越低越好,越高说明风险越大,损失越大,利润越小。
52.逾期率
(1)短期逾期:逾期天数简短的客户,如逾期3天、7天、15天,可根据贷款产品形态和还款方式设置监控值。
(2)中期指标:常见的M1、M2、M3以上逾期率等。可结合不同程度逾期情况设置贷后管理和催收策略。
(3)长期指标:不良率(逾期M6以上的比例)、核销率等。
(4)疑似欺诈指标:如首逾率、首3期还款逾期率和从未还款客户率(non-starter%),能够作为恶意贷款或欺诈客户的参考指标。
(5)迁徙指标:滚动率、迁徙率等,用来分析客户的逾期状态的变化。
53.贷款不良率
(1)贷款不良率=不良贷款本金余额(去除核销)/当前本金余额。主要用于反应资产的机构组成,并不能完全反应真实的贷款坏账风险。
(2)按照贷款风险程度可将贷款分为五级:正常、关注、次级、可疑、损失,后三者为不良贷款。
(3)逾期天数:比较通用的定义是逾期超过90天以上的贷款,就会被划分为不良贷款。不良贷款本金指的是逾期天数>90天的借款人所剩余的未还本金;当前本金余额指的是所有用户当前剩余未还的本金。
(4)与不良贷款率相关的一些指标
·逾期天数(DPD):已逾契约书约定缴款日的延滞天数,贷放产品自缴款截止日(通常为次-关账日)后第一天开始算。
·即期指标(coincidental)/递延指标(lagged):假设以月底为统计时间点观测,逾期客户数/在贷客户数就是即期口径的逾期客户率。但实际上,我们在统计当月月末时点的逾期率时当月放款的客户并没有到还款日,所以即期指标会对逾期率起到稀释作用,且受放款量增速影响较大。引入递延指标后,可在分母里剔除未满足统计条件的客户,更客观的反映还款情况。
·逾期期数bucket:也叫逾期月数,逾期30天内称为M1,30-60天未M2,60-90天为M3,以此类推,M3+则是通常说的不良。由于常见的贷款产品都是按月还款,因此一般而言,逾期了N期就是指客户在N个月的还款日没有还款。
·月底结算(month end):月底结算报表主要在表达各月月底结算数据,适用于消费金额所有产品。
·期末结算(cycle end):期末结算为信用卡特有的结算方式。账务及催收单位皆以cycle为作业同期。
·转呆账率:当月转呆账金额:逾期开始月的应收账款,经过年化之后,月转呆账率转换为年损失率。
·净损失率(NCL):当期转呆账金额减当期呆账回收,即为净损失概念。
·恶意延滞率(non-stater%):原始定义为贷后从未缴款客户,主要目的为找出恶意欺诈的案件。
·诈欺损失率:计算方式诈欺损失金额/签账金额,功能为观察信用卡签账金额中,发生伪诈骗状况并造成损失的比率。