处理等深分箱 深度不为整数的处理方法 equi-depth binning

@划分(Binning)

遇到处理等深分箱 深度不为整数的处理方法

N = [1, 2, 3, 4, 5, 6]
bins = 4

那么我们划分的深度 就是 depth = N/bins = 1.5>0
每个分箱给约1.5,这里其实可以进行拆分

将 1 划给第一个分箱 [1], 将剩余的 0.5 给下一个分箱子,这样下一个分箱就有 1.5 + 0.5 = 2 个数可取 ,也就是说 [2,3] 划给了第二个分箱,后面的处理也一样,这样我们就能得到完整的分箱:[1], [2, 3], [4], [5, 6]

以上depth不为整数的划分,depth为整数就比较好划分了
如果bins = 3 那么 depth = N/3 = 2
则每个分箱会获取到两个数据。
划分结果:[1, 2], [3, 4], [5, 6]

部分结果参考:https://stackoverflow.com/questions/34264268/equal-depth-binning-whether-it-is-just-grouping-data-into-k-groups

你可能感兴趣的:(机器学习,数据结构)