本文主要是风控的一些基本概念和理念,具体的风险定价、模型策略开发手段,后面慢慢做笔记。
一、业务基本概念
风险类概念,风险定价(RBP,Risk-based Pricing),根据用户人群、模型决策风险、外部征信数据等条件,给用户授予额度、费率和期次、APR(Annual percentage rate),一年一次复利计息的利率、NCL(net credit loss),净损失率、WO(Write-off),核销金额,FTP(Funds Transfer Pricing)。
金额类概念,贷款余额 ENR(至某时点借款人尚未偿还的本金,即全部剩余本金作为贷款余额)、ANR月均贷款余额 、AR(accounts receivable)当期应收账款、Collection催收、Loan Amount在贷总额、DBR(debit burden ratio)负债比,通常债务人的在各渠道的总体无担保负债不宜超过其月均收入的22倍。
评分卡概念,A card(Application scorecard,进件评分卡)、B card(Behavior scorecard ,行为评分卡)、C card(Collection Scorecard 催收评分卡,针对已逾期客户)、F card(Anti-fraud card)。
WOE(weight of ecidence,取值[-1, 1])、IV(information value,表示某个变量的预测能力)、 KS(klmogrov-smirnov,区分度指标)、PSI(population stability index,稳定性指标)。
逾期类概念,DPD(逾期天数,Days Past Due)= 实际还款日 - 应还款日,DPDN(表示逾期天数) >= N天,如DPD30+表逾期天数 >=30天的资产、FPD(First Payment Deliquency,首次还款逾期)、M1,逾期期数,指一笔放款连续逾期的月份数。
二、风险与运营
信用产品要素,贷款额度、贷款期限、贷款利率、还款方式(如先息后本)、受托支付、循环贷款中锁期的关注(影响建模、分析)、贷中信息获取。
模型与策略,目的在于识别好坏客户,评价的标准主要是ks\lift,模型兜底,策略补充。ipc技术,即人工策略分析,其实是个很好的思路,通过客户不同维度的口径数据进行营收、负债的数据核对校验,发现异常。其实本质就两点:信息验证 + 信用考核。
Gabage in, gabage out,错误的数据,模型再好,得到的也是垃圾结果。
资产质量指标,通过率、dpd0、dpd7、dpd30、M1、M2。
Vintage是非常好用的分析工具,迁移率的话,账单时点确实优于月末时点,更能反映真实资产质量。
三方数据测试,一手数据要明显好于二手数据(数据的质量更好,如查得率、 覆盖率、误拒率、有效差异率、无效差异率;数据的稳定性更好,特别是某个阶段或时点的数据延迟),实际调用时,做好备用数据源、异常机制处理(如调用失败空跑后,进入人工处理流程;如何发现数据源的问题,监测是关键)。
查得率(Search rate)=查得数/样本量
覆盖率(Cover rate)=查得命中黑名单数/样本中命中黑名单量
误拒率(Error reject rate)=查得命中黑名单数/样本中通过且为Good量
有效差异率(Effective difference rate)=查得命中黑名单数/样本中通过且Bad量
无效差异率(Invalid difference rate)=查得命中黑名单数/样本中其他拒绝量
三、风控分析手段
奥卡姆剃刀,如无必要,勿增实体。如果有两个性能相近的模型,我们应该选择更简单的模型,就是越简单越好。
没有免费午餐定理 (No Free Lunch Theorem),不存在某种算法对所有问题(有限的搜索空间内)都有效,如果一个算法对某些问题有效,那么它一定在另外一些问题上比纯随机搜索算法更差。
二八原则,收益分析是很重要的,80%的收益是20%的客户带来的。
增信手段,三稳:家庭、居住、收入工作;三品:人品、产品、抵押品;三表:水表、电表、工资表。
黑名单来源,催收公司、监管、行内黑名单。
特征构建,业务上,特征构造主要是时间维度的聚合统计、跨时间维度的特征比较。模型要覆盖不同维度的变量,存在中介经营客户信用的情况,缺失某方面信息的模型容易被攻破,收入、负债是最基本的。
对于贷后管理,最好是有时间上的动态数据(那么贷前呢?似乎也可以呐),但取起数来,十分的麻烦。
失联修复,一般通过运营商通话数据、详单进行,如有客户授权,可获取客户的手机通讯录或交叉营销获得的信心进行。
催收策略运营,催收策略一般会有2套以上,同时运行并3:7 或者2:8分配,少的部分就是测试,多的部分就是常规。监控数据效果,如果少的部分效果更好且稳定,那么就会逐步替代多的部分作为主要策略,如此更迭。
贷后一般分逾期阶段运营,前逾要尽量催难还款的客户,后逾尽量催好还款的客户,关键在于避免发生客户失联;同时贷后阶段也是良好的营销机会。
其他关注点:关注新增资产(客户)、渠道(老板要求关注到4级渠道)、舆情(如债务违约、河南灾情)、资产的动态评估和可核实性(房产现值,保守评估)、客户经营地址的有效性(催收时必须)。
四、风控的思想
贷前是最重要的,贷中和贷后的分析也应反馈到贷前,进行风控流程、模型策略的调整优化。贷前基本的风险包括:欺诈风险(比如腾讯和老干妈的萝卜章事件、房产的真实性、三方欺诈)、信用风险、政策风险(如最近大跌的教育培训行业),信用风险包括还款能力(信息不对称的问题,及持续盈利能力,因此行里某些行业是不做的)、还款意愿(软信息)。
业务上,良好的收入(永远大于抵押品等增信手段、第一还款来源)、与行业平均水平的比较、客户收益(特别是生意好的时候)的支出去向等,都很关键。
贷中的关键就是尽早识别风险,跑的越快越好,同时如果发现客群与产品设计不符(如产生较多坏客户,多头客户_现金贷类),则应及时调降贷前的放款期次。
大数据风控固然有用,高效自动,但某些风险点(如反欺诈)可以借助人肉、小数据进行,最好的方式是简单、有效,且能为模型、策略提供很好的业务视角,要保留少量人工。
数据要对比着分析才有意义,同样风险要结合收益考虑才能做出决策,广义上讲,只要收益高,没有不能接受的风险(风险管理的奥义,在于管理)。
拒绝客户的时间序列评分差异(IT审计的思维),可以去监视,拒绝的客户是不是真的差,改进模型、策略。
其实我自己有几个问题没想明白,记录如下:如何量化衡量客户的还款意愿、联系人信息\企业上下有的风险扩散与识别、客户生命周期的管理(虽然听着有点虚,但确实是很重要的一点,如贷款后客户生意越做越大,就好得很嘛;优质存量客户的经营管理;高风险客户的及时处置)。
附,参考资料:
1、消费信贷业务风控英文词汇手册,https://zhuanlan.zhihu.com/p/25951427
2、信贷圈:贷款审核的核心要素有哪些?,https://zhuanlan.zhihu.com/p/68212780
3、关于信贷业务链条的理解,https://zhuanlan.zhihu.com/p/44400966