Python分组分析简单实例

分组分析是指根据字段分组,将分析对象划分成不同的部分,以进行对比分析各组之间的差异性的一种分析方法。

常用的统计指标:计数、求和、平均值

分组统计函数:

groupby(by=[分组列1,分组列2,...])[统计列1,统计列2,...].agg({统计列别名1:统计函数1,统计列别名2:统计函数2,...})

参数说明:

by:用于分组的列

中括号:用于统计的列

agg:统计别名显示统计值的名称,统计函数用于统计数据

常用统计函数:size计数,sum求和,mean均值

但是当我使用这个函数时,系统报错

FutureWarning: using a dict on a Series for aggregation is deprecated and will be removed in a future version

或者

FutureWarning: using a dict with renaming is deprecated and will be removed in a future version return super(DataFrameGroupBy, self).aggregate(arg, *args, **kwargs)

这是由于Python升级不再使用这个函数语法了。

经修改

PyCharm

正常运行。

原始数据

data

分组统计后:

aggResult

你可能感兴趣的:(Python分组分析简单实例)