python 分布分析

python 分布分析_第1张图片

import numpy

import pandas

data = pandas.read_csv(

'D:\\PDA\\5.3\\data.csv'

)

python 分布分析_第2张图片

aggResult = data.groupby(

by=['年龄']

)['年龄'].agg({

'人数': numpy.size

})

python 分布分析_第3张图片

data.年龄.hist()

python 分布分析_第4张图片

bins = [

min(data.年龄)-1, 20, 30, 40, max(data.年龄)+1

]

labels = [

'20岁以及以下', '21岁到30岁', '31岁到40岁', '41岁以上'

]

data['年龄分层'] = pandas.cut(

data.年龄,

bins,

labels=labels

)

python 分布分析_第5张图片

pAggResult = round(

aggResult/aggResult.sum(),

2

)*100

pAggResult['人数'].map('{:,.2f}%'.format)

python 分布分析_第6张图片

你可能感兴趣的:(python 分布分析)