机器学习-特征工程 基础知识总结

特征工程包括【特征构造】【数值处理】【特征选择】

1.【特征构造】数据和特征决定了机器学习的上限:切片静态特征,切片聚合特征,时序聚合特征

2.【数值处理】:标准/归一化;缺失值填充;分箱方法;特征编码;

分箱方法:

风控场景下的常用特征分箱介绍:BestKs分箱、卡方分箱、聚类分箱等 - 百度文库 (baidu.com)

风控建模中的分箱方法——原理与代码实现 - 知乎 (zhihu.com)

特征编码:

Label编码,one-hot编码,Target编码,模型自动编码,Embedding嵌入,WOE编码

3.【特征选择】:WOE(weight of evidence 证据权重),IV(Information value 信息价值,是woe的加权和),VIF(variance inflation factor 方差膨胀系数),PSI(population stability index 群体稳定性指标)

你可能感兴趣的:(机器学习)