在数据分析的过程中,数据聚合与数据透视是两项非常重要的操作。Python的Pandas库提供了强大的工具——groupby
和pivot_table
,帮助我们高效地进行数据聚合和透视分析。本文将详细介绍如何使用这两个功能,并结合示例代码展示它们的实际应用,帮助更好地掌握数据分析的技巧。
groupby
groupby
是Pandas中用于对数据进行分组并进行聚合操作的工具。通过groupby
,可以将数据按某一列或多列的值进行分组,然后对每组数据进行统计计算,如求和、求平均等。
假设有一个包含商品销售数据的DataFrame,现在希望按商品类别汇总销售额。
import pandas as pd
# 创建示例DataFrame
data = {
'类别': ['水果', '水果', '蔬菜', '蔬菜', '水果'],
'销售额': [100, 200, 150, 80, 120]
}
df = pd.DataFrame(data)
# 按类别求和
grouped = df.groupby('类别').sum()
print("按类别汇总销售额:")
print(grouped)
在这个示例中,使用groupby
函数按商品类