完美且简要,如此输出风控中的重要数据指标曲线(如KS等)

先前,我们用excel给大家演示过一个KS的计算方式。
ks值是在模型中用于区分预测正负样本分隔程度的评价指标。每个样本的预测结果化对应的一个个分数,从最低分到最高分,输出为正负样本的累积分布。Ks值为这个两个正负样本中,最大差值的绝对值。我们知道,在sas里,算KS值是很方便的。用proc npar1way过程,就能求出ks值了。单单调用一个过程,其实对于使用一个过程步的同学来说,他们也比较好奇究竟是怎么算出来这个结果,本人就简洁扼要地说下怎样将ks输出到excel里。
如何用excel输出KS,先来看看展示出来的结果,请看算出来的效果:
完美且简要,如此输出风控中的重要数据指标曲线(如KS等)_第1张图片

并且在右上角,我们会把ks值做成表格的形式输出:
完美且简要,如此输出风控中的重要数据指标曲线(如KS等)_第2张图片

当然有表的形式,还是不够,还应该为KS值配上图。
完美且简要,如此输出风控中的重要数据指标曲线(如KS等)_第3张图片

输出图之前我们先梳理几个问题:以上是我们曾经开发过的一个KS图,KS值达到90%的模型的。Ks值够高了吧,但是看图就可以很明显地看出来,在分数达到某个值的(大概是将近680分的时候),模型有一个断崖式的走势。这样的ks值,其实对客群的分类并不完美。至于造成这种结果的原因,原因有很多,比如说容易用y预测y,俗称的变量穿越。成功的KS值图应该是这样的:
完美且简要,如此输出风控中的重要数据指标曲线(如KS等)_第4张图片

比较符合正常模型的走势。而且在中间某个点位置,KS值达到最大。一般正常来说:指标的合理性应该是这样:
完美且简要,如此输出风控中的重要数据指标曲线(如KS等)_第5张图片

最后将KS跟图表合在一起的,是长成这个样子的。
完美且简要,如此输出风控中的重要数据指标曲线(如KS等)_第6张图片

以上只是在众多风控模型指标里一个KS的数据输出内容。
如何让更多的童鞋接触到模型相关的指标并且直接简单的理解,比如用excel公式,就像上面提到的我直接就用excel输出相关的公式进行展示呢?
在这里插入图片描述

为了照顾新上手模型的同学,也为了让许多做策略的同学理解模型相关的指标乃至数据内容,本次我们给各位童鞋准备了一节可以用excel来学习模型的课程《风控策略中的模型须知——逻辑回顾评分卡及模型评估》。
这一节课程,没有复杂的公式推导跟代码内容,更多的是我们跟大家讲解清楚简易评分卡的制作过程和步骤,过程中我们尽量用最简单的表格给大家进行呈现与讲解,基本新手童鞋也能学会整个评分卡的核心思想跟逻辑。本课程适宜:新手模型小伙伴、策略开发童鞋不宜:算法大神、模型资深从业者

有兴趣的童鞋可关注:

相关内容如下:
完美且简要,如此输出风控中的重要数据指标曲线(如KS等)_第7张图片

课程部分内容预览如下,详情内容请参考:
①分组KS计算
完美且简要,如此输出风控中的重要数据指标曲线(如KS等)_第8张图片

②分组的卡方计算
完美且简要,如此输出风控中的重要数据指标曲线(如KS等)_第9张图片

③如何做cut-off切分
在这里插入图片描述

完美且简要,如此输出风控中的重要数据指标曲线(如KS等)_第10张图片

…课程部分内容预览。
另外关于风控模型的等系列内容,在我们许多课程跟内容都会涉及,比如知识星球社区中的模型相关内容,预览如下:
完美且简要,如此输出风控中的重要数据指标曲线(如KS等)_第11张图片

~原创文章

你可能感兴趣的:(番茄风控大数据公众号,算法,人工智能,机器学习)