数据分箱

数据分箱是数据分析中比较常用的方法,理顺以后一点也不难。
一、数组分箱
1,生成一个随机数组
数据分箱_第1张图片
2,用bins与cut函数进行分箱处理
数据分箱_第2张图片
3,利用value_counts统计每组分箱结果的个数
数据分箱_第3张图片
二、DataFrame分箱
1,定义DataFrame
数据分箱_第4张图片
2,再生成一列
数据分箱_第5张图片
3,利用bins与cut函数分箱
数据分箱_第6张图片
4,可添加标签
数据分箱_第7张图片
5,利用value_counts统计分箱下不同标签的数量
数据分箱_第8张图片
三、读取文件数据分箱
1,打开文件
数据分箱_第9张图片
2,利用list与索引方式将需要分箱的列转化为列表类型
数据分箱_第10张图片
3,利用bins,cut,value_count计算分箱结果
可结合right=True,right=False选择闭合方向,默认为右闭合
数据分箱_第11张图片

参考文章链接:https://blog.csdn.net/weixin_39778570/article/details/81117289

你可能感兴趣的:(python)