“你的模型准么?”
“你的模型真的有用么?”
“你的模型对风控有价值么?”
在为P2P公司建立风控评分模型过程中,这是最常见的问题。为了回答这一问题,我们想先讨论下如何从实际业务出发,以怎样的开发流程才能建立一个有效、有用、有价值的模型,希望读后能给你一定的启发。
在互联网金融风控体系中,量化分析需要贯穿始终,评分卡模型是其中非常重要的一环。
在互联网金融评分卡开发过程中,我们仔细研究了企业风控操作流程,反复推敲了模型构建步骤,最后我们认为从业务应用角度,评分卡开发应用应遵循:
业务定义 -> 风险定义-> 风险分解 -> 风险策略 这几个步骤。
业务定义
为什么把业务定义放在最底层呢?
从商务智能的角度说,模型,1评分,策略等都是为业务服务的,脱离了业务场景的模型和评分是无本之木,无源之水;脱离了业务场景谈模型的准确性,没有意义。
不同的业务场景,产生了不同的数据,不同的数据包含的规律,体现在数据分析中就是不同的模型、不同的参数和不同的评分。
比如,同样是网上的个人信用贷款,主要包含个人和企业主两大类客群。在中国,由于小微企业贷款困难,如果小微企业有了贷款需求,一般都是企业主以个人名义在网上贷款,但是这类客户显然是和普通个人信用贷款客户是不同的,所以这类客户的属性信息一般都包含了一些企业的信息,如资产,对公、对私流水等等。我们在做模型的时候,就会把他们分开:个人消费信贷模型和企业主信贷模型,企业主模型会包含一些反应小微企业财务状况的变量。
但是互联网金融所包含的业务种类远不止这两个,单纯的信用贷款类,就有专门放贷给学生的学生贷;在朋友圈之内贷款的朋友贷;给外企白领贷款的白领贷……
如果你拿学生贷的模型给农民贷客户来用,或者拿给上海白领开发的模型给甘肃、西藏的白领用会怎么样呢? 我不说你也明白了。
业务定义之后,还有一个要求,即业务模式的稳定性。即在一定时间范围内,用于构建模型的数据依赖的业务模式是相对没有变化的,前后一致的。只有满足这个条件,历史数据模拟出来的模型,和后面的数据才是匹配的。这在学术上有个术语,稳定性,Stationary/stability.
同理,我们也假设,符合同一类属性特征的个体,其表现行为也是一样的,即打分相同的人,表现也相同。这也回答了有人提出的另一个问题“我以前从没贷过款,也没信用卡消费记录,能用你的模型打分么?”
风险定义
简单地说就是判定哪些是好客户,哪些是坏客户。
互联网金融业务模式的多样性,导致了对好客户和坏客户的定义标准也不尽相同。 这里有人会问:“怎么会呢?欠钱不还的不就是坏客户么。”好吧,我来举个例子。
在我们清洗数据的时候,看到对客户信用评价中有这么一类“少量逾期”,这个类别占了相当大的比重,而且在模型中作用也比较显著,和其它类别“信用好”“信用差”等比肩。
一开始我们的技术人员对这个“少量逾期”这个分类很疑惑,不能理解这个分类到底是好还是坏。直到我们和某P2P公司的风控经理实际交流后才明白这其中的含义。宋总说:“……在传统银行信用卡业务中,是很喜欢这类少量逾期的客户的,因为他们能给银行创造罚息,但是又不是恶意违约那种客户。但对于我们P2P公司来说,是不敢养这类客户的,一旦有了逾期情况,就必须马上采取措施……”
说到这里您可以明白了吧,“少量逾期”是传统银行信用卡业务中经常出现的一个分类,而且算一个银行比较喜欢的类别,但是你把它也用到互联网金融试试?
风险分解
风险分解,就是用模型把目标客户分类。我们举个例子:
某跨国IT北京研发的总裁,提到发生在自己身上的案例:由于家里有急事,临时用钱,想申请某行的信用卡多给5万额度,但是某行不批。为什么呢? 因为刘总用这个卡主要是发工资的,每月到账后,夫人就会把钱拿去购买理财产品。因此卡上一般没多少钱。但是刘总是不是高风险客户呢?
显然,依据某行简单的分类方法,刘总被划为不能多给5万额度的类别了。长此以往,类似刘总这类高质量、低风险客户就有可能流失。
因此,选择正确的方法,合理分类,才能为进一步采取合理的商业策略提供正确有力的数据支持。评分卡是其中一个比较有效的工具。
在信用风险管理领域,评分卡是简便易行的风险管理工具。
什么是评分卡?
评分卡是综合个人客户的多个维度信息(如基本情况、偿债能力、信用状况等,重点关注偿债能力、还款意愿),基于这些信息综合运用数学分析模型,给个人综合评分,判断违约的可能性的工具。
生活中存在许多“显性”或“隐性”的“评分卡”。
例如:选购汽车--综合价格、油耗、安全系数、性能、外观等来因素。-> 买? 还是不买?
就分析方法发而言,现在分类算法有很多种,决策树,逻辑回归,支持向量机,神经网络等等,都可以实现这个目的。在以后的文章中,我们会详细讲解一下数据和模型的匹配性。数据决定了用什么模型。
风险策略
在给客户正确分类之后,即准确地风险分类。我们就可以采取相应的商务策略,优化业务:
- 流程简化:通过模型对客户分层,降低审核人员的工作量,提高审批速度。
- 风控优化:以客观分数代替主观评断,保证审批标准及风险偏好一致性。
- 风险定价:按照模型计算的违约率进行产品的定价。