pandas.group by 函数

group by函数在使用Python进行分组分析时使用非常频繁,使用group by可以对数据进行简单的分组分析。
一、分组列一列,计算列一列的写法

  • 一组分组列,一组计算列,一种计算方式
aggResult = data.groupby(by=['年龄分层'])['年龄'].agg({'人数': numpy.size})
grouped = data.年龄.groupby(data.年龄分层)
aggResult = grouped.agg({'人数': numpy.size})
  • 一组分组列,一组计算列,多种计算方式
aggResult = data.groupby(by=['class'])['score'].agg({'总分': numpy.sum,'人数': numpy.size,'平值': numpy.mean})
grouped = data.score.groupby(data.class)
aggResult = grouped.agg({'总分': numpy.sum,'人数': numpy.size,'平值': numpy.mean})

二、分组列两列,计算列一列的写法
- 两组分组列,一组计算列,一种计算方式

aggResult = data.groupby(by=['年龄分层'])['年龄','性别'].agg({'人数': numpy.size})
grouped = data.年龄.groupby(data.年龄分层,data.性别)
aggResult = grouped.agg({'人数': numpy.size})

你可能感兴趣的:(python初探)