信用评分模型python实践——简介

由于之前进行过信用评分模型的学习,并且接触并实践了一小段时间,虽然已经过了一年了,但是为了让这一段经历能够保留,在这里记录下点滴。本次将分多篇文章对信用评分模型的python实践进行阐述,包括简介,概念以及最后的代码实现。最后很高兴看这一系列的朋友们,也希望能帮到你,大家一起学习。

信用评分模型简介

信用评分模型运用数据挖掘技术和统计分析方法,通过对客户的人口特征、信用历史记录、行为记录、交易记录等大量数据进行系统的分析,挖掘出数据中蕴涵的行为模式、捕捉历史信息和未来信用表现之间的关系,发展出预测性的模型,以一个信用评分(credit score)来综合评估客户未来的信用表现。 

通过信用评分模型,银行计算出用户的信用评分,而此信用评分表示该用户的风险程度,评分的高低按照风险概率的大小进行排列,分数越高,风险越低;分数越低,风险越高。

信用评分模型python实践——简介_第1张图片

模型类型

如今在银行,P2P等各种贷款业务机构,普遍使用信用评分,信用评分卡大致可以分A,B,C卡三类。

  • A卡(Application score card)申请评分卡

  • B卡(Behavior score card)行为评分卡

  • C卡(Collection score card)催收评分卡

三种卡的介绍,请直接看这篇文章:比较全面的说了三种打分机制。梁世栋博士的《行为评分和贷后风险管理研究》http://www.docin.com/p-516772778.html

本文中将三个阶段进行了进一步的细化,分成以下模型

信用评分模型python实践——简介_第2张图片

 第三方征信

除了人行老大征信,以及各大银行自己的征信策略,随着互联网的如火如荼,各大互联网大佬们也推出了各自的征信系统,大家最熟悉的蚂蚁金服的芝麻征信,已经渗透到生活的方方面面,比如最近背负举债人人喊打的小黄车ofo,当年可以是推出了信用免押金模式(我的押金还在一千多万排名呢?),还有京东的小白信用等。

信用评分模型python实践——简介_第3张图片

芝麻信用

通过云计算、机器学习等技术客观呈现个人的信用状况,已经在信用卡、消费金融、酒店、租房、出行、婚恋、分类信息、学生服务、公共事业服务等上百个场景为用户、商户提供信用服务。

京东信用

主要从身份(社会属性、居住环境、教育情况和稳定性),资产(金融投资、信用能力和收支情况),偏好(登录、浏览、下单等维度),履约(金融产品、电商平台和社会行为中表现出来的履约和违约情况)和关系(社会关系和购物行为)来考量。

腾讯信用

是腾讯征信推出的个人征信管理平台,腾讯信用主要基于历史行为信息,通过采集不同维度的信息,运用大数据,机器学习以及传统统计方法相结合的技术手段来客观的反映用户的信用水平,从而得出用户的守信指数,用信用分来反映用户的信用水平,分数的多少是通过专业、先进的信用评分模型评估得出的,分数越高代表信用水平越高。

模型时间线

信用评分模型python实践——简介_第4张图片

和其他模型非常大不同,信用评分模型是一个漫长的过程,这就需要企业舍得花时间和精力去做了,目前也就是只有银行和互联网大佬有时间精力能力以及数据去做这件事情。我们通常分为观察期和表现期

  • 观察期:收集信用历史信息和行为特征等,可以认为就是特征
  • 表现期:即这次信用评分模型等目标,收集信用表现的信息,比如是否在这几个月内有拖欠,收益高低,卡是否被强停,是否有违约

 具体观察期和表现期的时间要根据模型而定,比如申请风险评分模型时间就较短,其实也很好理解,申请嘛,还没成为你的客户,而且现在正是获客,占领市场的关键时期,所以相对严格度会低一点。但是行为评分模型时间就更长一点,路遥知马力,日久见人心,好好观察后,才能对你进行评判,想想我们办事,处对象也是如此,?。

模型特征

这里我就举行为模型常用的客户特征,如下表所示,不同模型的侧重点也不一样。

消费行为:最近3个月消费金额、消费笔数,最近3期境外消费金额占比,最近3期网银消费笔数 等

还款行为:最近3个月最大逾期天数、还款率、逾期还款期数,最近6个期账户逾期月数,最近12个月未欠款账单数 等

账户属性:信用额度,开卡时间,收益率、发卡机构 等

客户属性:年龄,收入,性别,户籍状态 等

 

信用评分模型的介绍先到这,可能说的比较简单,先让大家感受感受一下这类模型的特点,从下一节开始,我们将阐述信用模型涉及到的一些数学理论概念等,并进行python实践,大家一起加油吧,?。

 

对了,推荐一本信用评分模型等入门书籍《信用评分模型技术与应用》。

你可能感兴趣的:(信用评分模型)