数据分析案例(四)——评分卡模型(一)

一、业务学习

1 信用体系:

  • 金融市场风险包括:市场风险,信用风险,流动性风险,操作风险
  • 信用风险:交易对手未能履行约定契约中的义务而造成经济损失的风险,即收信人不能履行还本付息的责任而是受信任的逾期收益与实际收益发生偏离的可能性,是金融风险的主要类型。
  • 贷款产品的两种基本类型:
    • 信用类贷款产品:无标的物作为贷款抵押,放款和还款依据均为个人信用
    • 抵押类贷款产品:有标的物作为贷款抵押,贷款逾期时借贷方有权处置抵押物
  • 刻画信用风险有关指标:
    • PD:probility of default,违约概率
    • 评分卡模型主要用于衡量该指标的大小
    • LGD:loss given default,违约损失率
      • 违约所造成的损失数额,即损失的严重程度,与特定交易相关联(无抵押与有抵押的违约损失率不一样)
      • LGD = 1 - 回收率
    • EAD: 违约风险敞口(头寸)
      • 违约行为导致的可能承受风险的信贷余额
    • RWA:风险加权资产
      • 以风险系数为权重加权求得的资产
    • EL:期望损失
      • LGP*PD

2 信用评分策略

  • Score +Policy Rules +Terms of Business(运营条款) = Strategy

3 信用评分卡介绍

  • 以分数的形式来衡量风险几率的一种手段
  • 是对未来一段内违约/逾期/失联概率的预测
  • 有一个明确的正区间
  • 通常分数越高越安全
  • 数据驱动
  • 非信贷场景中的评分卡(用的比较少)
    • 推荐评分卡
    • 流失评分卡
  • 评分卡的优势
    • 便于理解和使用
      • 易于被各层次的业务人员所理解
    • 内部很容易实施和监控
      • 很容易作为业务规则部署在业务系统中
      • 当四场环境发生变化时,也很容易了解各个构成要素对信用品评分的可能影响的大小和方向

4 A、B、C评分卡

A卡

  • 申请评分卡,Application score card
  • 应用于信贷领域的申请环节,对申请人的信用资质进行评估,决定是否批准贷款申请
  • 银行、消费金融公司、消费分期平台、网贷平台
  • 输出:是否同意个人的贷款/信用卡申请及发放级别

B卡 Behavior score card

  • 贷后监控,起到预警作用
  • 在对申请者放款后,由放款机构定期监控贷款者在贷款周期结束之前的风险,评估未来一段时间的违约概率
  • 可使用客群信息,账户信息,消费行为,还款宽行为等维度进行建模

C卡:催收评分卡

  • 对于存在违约风险的客户实现差异化催收,减少,降低损失
  • 回款预测模型:预测逾期后未来还款数量,确定催收策略(如果未来都不还了,就马上催收)
  • 响应率模型: 预测客户在不同手段下的还款响应率,确定催收手段
  • 失联率模型: 预测客户最终失联的概率,为催收策略的重要风险因子

5 FICO信用评分考虑的五方面因素及权重

  • 偿还历史:35%,有没有曾经这个行为
  • 信用账户数:30% 其他的银行的账户数,有几个比较好的账户是可以加分的,但是太多有问题(可以拆分)
  • 使用信用的年限:15% ,使用的越久越好,习惯成自然
  • 新开信用账户:10%
  • 信用类型:10%

6 信息来源

  • 信用卡申请表
  • 其他来源
    • 行为评分
    • 账户存在累计时间
    • 过去12个月最严重拖欠行为(无拖欠、1月拖欠)
    • 过去12个月的平均贷款余额
    • 过去6个月现金提取额占交易额比例
    • 过去6个月平均消费额、消费刷卡类型
  • 其他信息
    • 个人网络知名度
    • 法院诉讼信息
    • 工商企业相关信息

7 如何定义坏样本

  • 观察点:提交表格的这个时候
  • 观察期:提供评分计算中所需信息的时间窗口(所需的变量时期)
    • 用于搜集相关变量和特征的,通常在3年内
    • 可包括带时间切片的变量
  • 表现期:确认是否出现违约行为(即坏样本)的时间窗口
    • 通常是6个月-1年,不然成本过高。结果之后的数据是不用的,这样判断是否是号样本或者坏样本。


      image.png
  • M0:最后缴款日的第二天到下一个账单日(账单日:账单日是指发卡银行每月会定期对你的信用卡账户当期发生的各项交易,费用等进行汇总结算,并结计利息,计算你当期总欠款金额和最小还款额,并为你发送对账单。)
  • M1:M0时段的延续,即在未还款的第二个账单日到第二次账单日的最后缴款日之间
  • M2: M1的延续,即在未还款的第三个账单日。。一直类推

7.1 商业理解:如何定义违约(坏样本)

  • M3 & M3+ 逾期
    • 低于M3的行为可以考虑作为影响因素纳入模型
  • 债务重组
  • 个人破产
  • 银行主动关户或注销
  • 其他违法行为
  1. 小于预期实现的该如何考虑?
    • 可以考虑这一部分数据的比例大小,较少时可以直接删除
  2. 银行的目的是什么?
  • 扩大市场占有率,这个时候往往对坏账率有较强的容忍度
  • 意图是扩大利润,就可以把坏定义为拖欠其短一些
  1. 本项目的最终策略
  • 表现其未拖欠为好
  • 3个月及以上为坏样本
  • 1-2个月拖欠数据删除不用(因为比例比较低,进不了模型)

7 建立评分卡

  • 理想情况下,充足的样本来那个,应当尽量建立不同的多个模型
  • 各种各样的贷款产品
    • 房贷、车贷、小额消费贷款
  • 申请人的不同潜在业务价值
    • 学生、高端客户、低端客户
    • 白金卡、金卡、普通
  • 除了基于业务理解分类外,也可以从数据分析(聚类)的结果进行归类

常用模型:

  1. logistic回归
  • 优点:简单、稳定、可解释,技术成熟,易于检测和部署
  • 缺点:准确度不高
  1. 决策树
  • 优点:对数据质量要求低,结果易解释
  • 缺点:准确度不高
  1. 其他模型
    4.组合模型(互联网金融做的多)
  • 优点:准确度高,不易过拟合
  • 缺点:不易解释,部署困难,计算量大

流程:

  1. 探索性数据分析:对自变量与因变量的取值与分布进行探索性数据分析
  2. 单变量分析:深入分析每个自编拉你个与因变量之间的关系,确定关键性预测变量,对变量取值进行分组
  3. 建立步骤评分卡:使用Logisitic回归方法建立自变量与因变量的预测模型,并将模型结果转化为评分卡形式。分箱->建模->评分卡
  4. 拒绝推断:考虑那些被拒绝贷款的客户对模型结果的影响进行拒绝推断??
  5. 单变量分析:在考虑拒绝贷款可的情况下深入分析每个自变量与因变量之间的关系(来看是否是稳定的)
  6. 最终的评分卡
    7.模型验证

补充资料:woe、iv

你可能感兴趣的:(数据分析案例(四)——评分卡模型(一))