华泰实习日记:评分卡建模流程

总包score_card
1 包 score_card.data_preprocess(用于数据预处理)
1.1 方法 CalNoOfDays(用于将两列日期转换为相差的天数)
1.2 方法 MissingValue(用于填充缺失值,4种方法)
1.3 方法 SplitData(用于数据集的划分)
2 包 score_card.woe(用于分箱,计算各个档位的woe值,计算IV值)
2.1 类 WOE(执行已有分箱算法,计算各个档位的woe和VI值可视化)
2.1.0 方法 fit(执行分箱)
2.1.1 方法 get_woe()
2.1.2 方法 get_IV()
2.1.3 方法 drop_low_iv()
2.1.4 方法 transform(进行woe转换)
2.2 类ScoreCardSK(主要负责logistic regression训练,评分卡输出,共线性诊断。封装逻辑回归,支持L1/L2正则。Penalty是正则化选择。)
2.2.1方法:fit()
模型训练
2.2.2方法:score(x_woe)
评分,返回分数的df
2.2.3方法:calc_vif()
返回显示vif的df,检查共线性
2.2.4方法:summary()
返回模型的显著性分析的df

3 包score_card.utils(用于评估)
2.1方法:plot_ks_curve()
画ks_curve
2.2方法:plot_roc_curve()
画roc_curve

你可能感兴趣的:(华泰实习日记:评分卡建模流程)