提出传统意义上的信贷风险控制主要关注两个方面:贷前审批控制违约概率(PD)和贷后处置降低违约损失率(LGD)。
这里介绍一下本文关于风控抓手与风控建模方面的一些思考,具体步骤如下:
模块1 信贷风险控制主要关注2个方面
模块2 征信衍生指标的维度和逻辑
模块3 基于KS筛选变量
▍信贷风险控制主要关注2个方面
为了控制违约概率,银行通常要求客户提供多项资料来证明其具有有能力且有意愿按时归还贷款的能力。银行流水、收入证明、房产证、车辆行驶证等文件都是为了证明借款人的还款能力。公务员、企事业单位、银行从业人员及知名企业员工等职业群体更容易获得贷款,因为他们的收入相对稳定,违约成本相对较高,违约概率较低。
降低违约损失率的方法也相对简单,就是寻找优质抵押品。在中国,由于房价在过去二十年里持续上涨,房产抵押成为最为理想和安全的抵押物。其次是汽车。过去二十年,中国银行业在零售贷款方面采取了较为宽松但有效的策略,房屋按揭贷款几乎占据了银行零售贷款的大部分份额。
对于小微贷款而言,更倾向于将贷款放给企业的法定代表人或实际控制人(对于小微企业而言,这两个身份往往是重合的)。主要原因是企业具有有限责任,而个人则有无限责任,这意味着违约责任的不同,风险表现也会存在差异。此外,相较于个人贷款(甚至可以不开立账户,直接放款至其他银行卡),企业贷款的开户流程更为复杂,需要收集的资料较多(如工商信息、实际经营地址、法定代表人、营业执照、财务主管、受益人等),这也是其中的原因之一。
车辆抵押贷款之所以成立,是因为当客户购买新车时,通常支付了30%的首付款;而在二手车抵押时,金融机构对车辆评估价格会进行折扣处理。从经济上讲,当客户的违约成本大于守约成本时,客户的逾期率会下降。而在金融机构处置资产时,由于处置价格与市场价存在差异,因此损失率(LGD)也可以被控制。
然而,所有这些前提都建立在车辆价格稳定的基础上。对于新车来说,一年、两年甚至三五年后,市场价格会逐年有序地小幅下降。因此,在贷款期限内的任何时间点,车辆价格的下降幅度都应小于客户首付款加上已还贷款金额的总和,或者小于车辆抵押时市场价格与已归还贷款金额之间的差额。只有在这种情况下,才能确保贷款的安全性和可控性。
▍征信衍生指标的维度和逻辑
征信指标是评估个人或企业信用状况的重要依据。除了额度、借款、还款、逾期四大维度,我们可以从金额、时间、机构数、次数等角度进行衍生指标的构建,以提供更全面的信用评估。
首先,从金额维度来衍生指标可以考虑以下几个方面。我们可以根据个人或企业的借款金额总和、平均借款金额、最大借款金额等指标来评估其借款行为的规模。此外,还可以计算借款金额在不同时间段内的变化趋势,以及借款金额与借款目的之间的关系,从而进一步了解借款行为的特点和倾向。
其次,从时间维度来衍生指标可以考虑以下几个方面。我们可以分析个人或企业的借款周期、借款期限、还款频率等指标,以了解其在借款和还款过程中的时间管理能力和还款意愿。此外,我们还可以计算借款的时间间隔、借款历史时长等指标,以评估其借款行为的稳定性和长期信用表现。
另外,从机构数维度来衍生指标可以考虑以下几个方面。我们可以统计个人或企业在不同贷款机构借款的数量,以了解其贷款行为的多样性和与不同机构的合作关系。此外,还可以计算借款机构的变动情况,以评估其与机构之间的信任程度和稳定性。
最后,从次数维度来衍生指标可以考虑以下几个方面。我们可以统计个人或企业的借款次数、还款次数、逾期次数等指标,以了解其借款行为的频繁程度和还款能力。此外,还可以计算不同类型借款的次数分布,从而进一步分析其借款偏好和风险倾向。
通过对征信指标的这些维度进行衍生,我们可以更加全面地了解个人或企业的信用状况和借款行为特点。这些衍生指标将为信用评估提供更多的信息和维度,有助于提高风险控制和信用决策的准确性和精确性。
▍基于KS筛选变量
一般而言,当一个变量的KS值大于或等于5%时,我们认为该变量对好坏客户具有基本的区分能力。那么为什么选择5%作为标准呢?为什么不能是4.9%或者4.5%呢?实际上,5%只是前辈们在不断实践中总结出的经验值。同时根据之前的实验,我们发现KS值会随着分箱逻辑的不同而略有差异,也就是说,即使换一个分箱逻辑,5%的KS值可能会变成4.8%或者5.2%。但可以确定的是,在合理的分箱数量范围内,调整分箱逻辑不会将KS值提升到15%以上,因此具有更高KS值的变量的区分能力整体上优于相对较低KS值的变量。
因此,在初步筛选变量时,5%只是一个经验值,可以根据实际情况进行调整。例如:
- 当我处理1万+个变量时,我会选择使用KS值大于15%进行初步筛选;
- 当我只有几十个变量时,我可能会使用KS值大于4%进行初步筛选。
通过根据实际情况调整筛选标准,我们可以更好地选择具有较好区分能力的变量,从而提高模型的准确性和可靠性。
▍总结
本次主要从金融风控关于贷前违约概率(PD)和贷后违约损失率(LGD)的抓手、征信指标衍生、基于KS筛选变量等方面,对信贷风控进行介绍和思考。但实际风控建模中仍有很多细节值得探索与思考,这是一件非常有意义的事情。也期待各位在学习时能够保持独立思考能力,脚踏实地的不断优化数据科学知识。