使用pandas中的cut方法对数据进行分箱操作

Pandas库中的cut()方法可以用来对数据进行分箱操作

nums = np.random.uniform(0,100,size=30) #随机生成0-100之间的30个数字
nums = np.round(nums,1) # 保留一位小数
group = [0,59,70,85,100] # 分组划分
print(result = pd.cut(nums,group))
# 判断nums中的每个数字属于哪个区间
# [(0, 59], (85, 100], (0, 59], (70, 85], (0, 59], ..., (0, 59], (0, 59], (0, 59], (85, 100], (0, 59]] 
# Length: 30 
# Categories (4, interval[int64]): [(0, 59] < (59, 70] < (70, 85] < (85, 100]]

你可能感兴趣的:(机器学习,python,数据分析)