关于模型结果转评分卡的几点疑问

一直对评分卡模型有几点疑问。
1.为啥最后要转化为评分,二分类模型最后predict的概率值不可以直接用吗?
2.为啥使用ODDS,也就是好坏比去生成最后的评分公式
3.如何控制分数范围?
为了回答以上几点疑问,我们先来学习一下评分卡转换的过程。
首先引入一个概念–ODDS
在这里插入图片描述
ODDS是客户好坏比,其中P代表客户违约的概率,那么好坏比就是客户违约概率与不违约概率的比值。可想而知,如果odds>1,客户倾向于违约,odds<1,客户倾向于不违约。
也就是说,ODDS是一个描述客户违约程度的指标,范围在[0,正无穷),与客户违约程度成正比。
我们将odds作为未知数x去生成评分y,我们希望x与y是呈反比的关系,也就是客户违约概率越高,评分越小。这里使用了对数函数进行构造。
在这里插入图片描述
上式便是由模型预测概率转换为评分的公式。现在公式的构架有了,就要确定系数。确定系数的过程,也是我们确定评分范围的过程。
1.确定截距A
当未知数x=0时,我们可以得到截距值A。当X=0时,odds=1,这说明此时客户不好也不坏,也就是说A是个基准分。如果我们希望分布是分布在0-100之间的话,那么50分就是基准分。此时A=50
2.确定系数B
计算B,按照官方说法是,当好坏比odds上升一倍时,我们希望分值降低多少。比如,当odds上升一倍时,我们希望分值降低10分,那么当odds=2时,y=40,这是就可以计算出B。
但是笔者在此处还是略有疑惑,如何才能科学地设定PDO?也就是当好坏比上升一倍,分数降低几个PDO单位。
关于模型结果转评分卡的几点疑问_第1张图片
笔者认为,PDO应该根据我们希望设定的分数范围来设计。当odds趋向无穷大,也就是客户为坏时,我们所定的最低分。具体的原理关系,我还是没有想通,先暂且记录下来。
现在似乎是可以回答笔者最先提出的三个问题。
1.为啥最后要转化为评分,二分类模型最后predict的概率值不可以直接用吗?
关于这个问题,笔者认为可能是想标准化模型结果,而且评分卡的设计易于理解和使用。
2.为啥使用ODDS,也就是好坏比去生成最后的评分公式
odds是统计学中的一个指标,也叫优势比或让步比,多应用在流行病学对比研究中。
评分卡中使用odds,而不是直接使用proba,可能是考虑到目标函数中因变量的值域,对数函数要求因变量>0,评分卡函数值域在正负无穷之间,所以使用odds。若直接使用proba,其范围在[0,1],不满足构造函数的条件。
3.如何控制分数范围?
应该是通过截距A与系数B来控制,但是如何设置,笔者还未想清楚。有兴趣的朋友可以留言讨论。


文章最后放一个逻辑回归转换的标准评分卡。
关于模型结果转评分卡的几点疑问_第2张图片
关于模型结果转评分卡的几点疑问_第3张图片
其中欧米伽表示变量转换后的woe值。(转于知乎)

你可能感兴趣的:(关于模型结果转评分卡的几点疑问)