大话 Python:python 操作 excel 系列 -- 数据汇总与统计

在完成了前面系列的数据整理、数据清洗、数据提取与筛选之后,我们需要对进行进一步的汇总与统计使数据变成我们的可用信息。

1,数据分类汇总

# 对指定列分组后进行数量统计
data_inner.groupby('name').count()
# 对指定列分组后,统计 id 字段的数量 
data_inner.groupby('name')['id'].count()
# 对某两个字段进行分组后,统计 id 字段的数量
data_inner.groupby(['name','age'])['id'].count()

2,数据统计

# sample() 函数简单的数据采样,设置 n 的数值为 5
data_inner.sample(n=5)
# sample() 函数的 replace 参数表示采样后是否放回,值为 False 表示不放回,值为 True 则表示放回
data_inner.sample(n=5, replace=False)
# 采样描述统计,返回数据的数量、均值、标准差等信息
# round() 函数参数值设置为 2 表示保留两位小数
data_inner.describe().round(2).T

此处数据统计只是最简单的模式,python 关于数据统计提供了更加细致的操作,比如统计协方差、相关分析、标准差等数据统计方式,有相关统计学知识才学习起来更加方便。
更多精彩前往老王说编程>>>
image.png

你可能感兴趣的:(pythonexcel数据统计)