【风控模型】WOE编码与IV值

**WOE:**证据权重(Weight of Evidence),WOE编码是评分卡里面重要的特征转换方法,可以将非线性变量线性化处理,提高业务解释性,同时能够消除异常值的影响,减少小概率事件对最终评分影响的权重。
WOE的主要作用是描述预测变量与目标变量之间的关系。WOE的实质是表示当前分箱中好坏客户的各自占总体好坏客户比例的差异;
WOE是对原始变量的一种编码形式,要对一个变量进行WOE编码,首先需要把这个变量进行分组处理,即分箱或者离散化,常用离散化的方法有等宽分组,等高分组,或者利用决策树来分组。

**IV:**信息价值(Information value)主要作用是用来衡量特征与目标变量之间关系的强度。

因此,woe描述了预测变量与目标变量之间的关系;IV值衡量了这种关系的强度。

你可能感兴趣的:(机器学习)