vintage的计算逻辑案例实操与可视化

今天,为大家分享vintage计算逻辑和可视化分析实战。

vintage的计算与可视化

vintage介绍

Vintag一词最初来源于葡萄酒业 。由于每年采摘的葡萄会受到日照、气温、降水等因素的影响,最终酿造的葡萄酒品质会存在差异。在窖藏一定年份后,葡萄酒的品质将趋于稳定,也就是品质成熟,这段年份数被称为成熟期。

表1 葡萄酒的vintage表

vintage的计算逻辑案例实操与可视化_第1张图片

我们以酒精浓度作为衡量葡萄酒品质的标准约定:浓度越高,品质越好。首先,记录入窖年份作为该批次葡萄酒的标签,这也被称为Vintage。后续我们将每年定期抽样测量酒精浓度,保存记录数据。经过几年的数据积累,我们就可以绘制出酒精浓度随时间变化的Vintage曲线。俗话说,酒越酿越醇,Vintage曲线通常是单调递增的,到最后会趋于稳定。

vintage的计算逻辑案例实操与可视化_第2张图片

图1 vintage曲线

在信贷领域中,我们来看用Vintage曲线分析资产质量的变坏过程变化规律。在此列举了Vintage分析过程中两个领域的对应关系如下表所示:

表2 两个行业的映射表

vintage的计算逻辑案例实操与可视化_第3张图片

详情见历史文章:

智能风控体系之vintage分析icon-default.png?t=N7T8http://mp.weixin.qq.com/s?__biz=MzI4NDE3NDk4MQ==&mid=2650842780&idx=1&sn=7a703de42b12675a8edee2ef78428d2d&chksm=f00b7976c77cf060dac66b5b3ba353523e7ca4965c2a0eecd1e9064d3a58649f62d3f207a0de&scene=21#wechat_redirect

vintage计算逻辑

Vintage计算涉及借据表和还款计划表,其中结清状态字段:已结清(提前结清、还款日当天结清、逾期结清)、未结清(未到还款日、还款日未还、逾期未还)。

借据表涉及字段为客户号、授信号、借据号、期限、借据本金、利息、剩余本金、还款方式、借款日期、贷款始期、贷款止期、结清日期、还款状态、当前最大逾期天数、历史最大逾期天数。

还款计划表涉及字段为还款计划号(主键)、借据号、期序、应还日、实还日、当前逾期天数、历史逾期天数(该账期内历史最大逾期逾期天数)、应还金额、剩余本金、应还本金、应还利息、应还罚息、实还金额、实还本金、实还利息、实还罚息、结清状态。

可以根据不同的逾期观测口径来计算逾期天数。对于"曾经(ever)逾期"口径,只要用户在观察点之前的任意时间点发生过逾期,无论观察点上是否结清,都认为该笔借据处于逾期状态。因此,逾期天数可以通过观察日与最近一次逾期发生日期之间的天数来计算。

对于"当前(current)逾期"口径,只有在观察日上仍处于逾期状态的借据才会被认为是逾期的。如果在观察日上已经结清,则不认为该借据逾期。因此,逾期天数可以通过观察日与最近一次逾期发生日期之间的天数来计算,前提是观察日上借据仍处于逾期状态。

需要注意的是,对于"曾经逾期"口径,逾期率的计算可以保证vintage曲线单调不减。而对于"当前逾期"口径,vintage曲线可能不是单调上升的,而是可能下降的情况。

统计还款计划表内每一期序的该账期内历史最大逾期逾期天数是否达到>=30天的情况,一旦客户在某n期的还款表现中逾期变坏了,那么它的后续还款计划表中的n+1及以上期序均为逾期情况,将其统计在逾期订单数或者逾期贷款余额内。按照不同的MOB账龄进行分别统计某个放款年月下逾期率变化趋势。

图片

实战代码

①数据集

vintage的计算逻辑案例实操与可视化_第4张图片

②读取数据

vintage的计算逻辑案例实操与可视化_第5张图片

③数据清洗

vintage的计算逻辑案例实操与可视化_第6张图片

vintage的计算逻辑案例实操与可视化_第7张图片

vintage的计算逻辑案例实操与可视化_第8张图片

④计算思路

下面开始具体的vintage分析,首先要确定一些问题:

1.依据一个人的首贷日期作为判断依据来分成各客群,这里我选择2016年1月开始到2017年一月的,这样就有13个客群了。

2.然后月度账龄的切分:借款当月的月底到下月月底,所以我选择以月底为依据计算

3.逾期情况,也就是纵坐标,这里我选择逾期客群占比,这里的关键问题就是怎么定义?我选择的是:各还款月份当下有出现还款缺失或逾期的,只算当月

4.三个关键点确定后,就是实操,主要流程是:1筛选目标数据,2化为目标客群,3切分时间范围,4统计当月逾期&缺失,5初步统计出表,6折线图可视化

⑤逻辑计算

vintage的计算逻辑案例实操与可视化_第9张图片

vintage的计算逻辑案例实操与可视化_第10张图片

vintage的计算逻辑案例实操与可视化_第11张图片

⑥计算某个月

vintage的计算逻辑案例实操与可视化_第12张图片

vintage的计算逻辑案例实操与可视化_第13张图片

最终结果

vintage的计算逻辑案例实操与可视化_第14张图片

可视化1

vintage的计算逻辑案例实操与可视化_第15张图片

vintage的计算逻辑案例实操与可视化_第16张图片

可视化2

vintage的计算逻辑案例实操与可视化_第17张图片

vintage的计算逻辑案例实操与可视化_第18张图片

写在最后

只有实战模拟面试场景,才能让一些关键的因素在脑海里留下深刻的记忆,直到知识融入到皮肤里,不断地熟悉并掌握面试题的内容,深入到底层的风控知识体系。

你可能感兴趣的:(智能风控,python,数据分析,数据挖掘,数学建模,金融)