金融风控实战入门-逻辑回归评分卡

1.评分卡

  • 建立逻辑回归模型
  • 对模型进行评分映射

2.需要进行监控的指标

分数分布、模型psi、变量psi、低分原因、捕获率、模型ks

问题

(1)如果各家公司都用三方数据进行建模,那建模得到的模型是否都大致相同?
答:
分享一个案例,客户曾经用征信报告中的指标作为入模变量进行建模,但是尝试用报告详单中的底表数据进行更多特征的加工后,模型效果提升了两三倍。

(2)模型训练时,l1正则化和l2正则化在使用上有什么区别?
答:
l2正则化效果更好一些,l1正则化可以用于特征的筛选。

(3)xgb为什么也需要做分箱和bi-var?
答:
分箱是可以增强模型鲁棒性的,但同时会损失一定的精度。做lgb的时候可能不会做分箱,但是做xgb还是会做一个分箱,使xgb具备更强的鲁棒性。
案例:线上xgb,线下lr陪跑(既要xgb的精准度,又要lr的可解释性)。两个模型入模特征的加工逻辑需要一致,因此对xgb模型的入模变量也进行了bi-var单调性变换。

(4)xgb怎么保证模型的稳定性?
答:
首先要保证,变量的分布是稳定的。
其次,可以尝试对变量进行分箱。

(5)测试集的ks有可能比训练集高吗?
答:
有可能。可能是模型欠拟合,也可能是数据原因。

你可能感兴趣的:(模型,逻辑回归,机器学习,人工智能)