什么是分桶特征?(一张图就理解了)

分桶特征:

将连续型数值划分到不同的桶中(换句话说,将连续型特征离散化

  • 举个例子:
    将某地人口特征分为以下3个分桶:
    什么是分桶特征?(一张图就理解了)_第1张图片
    经过分桶,人口矢量 [[10001],[5001],[1]] 将变成 [[1],[2],[0]]
    (惊奇的发现这些特征值被变换成了桶的索引,而索引是离散特征)
    一般来说,这些特征将会被进一步转化为独热编码(以透明方式实现)

你可能感兴趣的:(解决各种问题,python,机器学习)