逻辑回归-评分卡模型

【逻辑回归】

在建立评分模型时,我们通过使用逻辑回归进行建立模型对数据进行训练,模型给出一个分类好坏客户的一个概率值;并不是评分卡的分值。


【评分卡定义】

评分卡中好坏客户的定义,假设通过历史数据定义,近1年逾期次数为大于等于M2词作为违约客户,则将好坏客户通过数学公式表示。
假设P为坏客户的概率,则1-P则为好客户概率。

【逻辑回归–公式】

坏客户概率计算公式
在这里插入图片描述
好客户概率计算公式
在这里插入图片描述
好坏客户的占比(坏客户/好客户),几率
在这里插入图片描述
评分卡的分值通过以下公式计算可得,A和B是常数;其实分数是比率对数的线性表达式,式中的负号可以使得违约概率越低,得分越高。通常情况下,这是分值的理想变动方向,即高分值代表低风险,低分值代表高风险。即
在这里插入图片描述

计算A和B的值,需要进行两个假设

a.给某个特定的比率设定一个特定的预期分值。
b.确定比率翻倍的分数(PDO)
我们首先假设比率为x的特定点的分值为P。则比率为2x的点的分值应该为P+PDO。代入式中,可以得到如下两个等式:
在这里插入图片描述
假设评分刻度是1:20(违约正常比)时的分数为 100,PDO为20分,带入解的B=14.43,A=6.78
确定了A和B之后就确定了score公式。
评分卡的计算公式为
在这里插入图片描述
每个分项分值的计算:
a.将样本进行了WOE编码化w,带入逻辑回归模型中计算得出每个特征的系数j
b.刻度分值B已知;则分项分值为-(Bwj)
c.最终生成完整的评分卡。
注:
1.进行交叉验证的方式提高模型的稳定性。
2.通常,该分值将四舍五入到最近的整数,以简化评分卡的表现形式和可解释性。这种四舍五入将得到分值的近似值,但其影响很小,可以忽略不计.

你可能感兴趣的:(机器学习)