数据分箱是数据分析中比较常用的方法,理顺以后一点也不难。
一、数组分箱
1,生成一个随机数组
2,用bins与cut函数进行分箱处理
3,利用value_counts统计每组分箱结果的个数
二、DataFrame分箱
1,定义DataFrame
2,再生成一列
3,利用bins与cut函数分箱
4,可添加标签
5,利用value_counts统计分箱下不同标签的数量
三、读取文件数据分箱
1,打开文件
2,利用list与索引方式将需要分箱的列转化为列表类型
3,利用bins,cut,value_count计算分箱结果
可结合right=True,right=False选择闭合方向,默认为右闭合
参考文章链接:https://blog.csdn.net/weixin_39778570/article/details/81117289