2019-02-22 连续特征的离散化:在什么情况下将连续的特征离散化之后可以获得更好的效果?

1. https://www.zhihu.com/question/31989952/answer/54184582

 2. https://blog.csdn.net/u010358304/article/details/80693541




连续特征离散化的基本假设,是默认连续特征不同区间的取值对结果的贡献是不一样的。

所以希望连续特征在不同的区间有不同的权重,实现的方法就是对特征进行划分区间,每个区间为一个新的特征。常用做法,就是先对特征进行排序,然后再按照等频离散化为N个区间.


无监督方法: 分箱法直观划分. 分箱法又分为等宽分箱法和等频分箱法

有监督方法: 

你可能感兴趣的:(2019-02-22 连续特征的离散化:在什么情况下将连续的特征离散化之后可以获得更好的效果?)