Python数据分析利器之groupby和pivot_table使用详解

Python数据分析利器之groupby和pivot_table使用详解_第1张图片


概要

在数据分析的过程中,数据聚合与数据透视是两项非常重要的操作。Python的Pandas库提供了强大的工具——groupbypivot_table,帮助我们高效地进行数据聚合和透视分析。本文将详细介绍如何使用这两个功能,并结合示例代码展示它们的实际应用,帮助更好地掌握数据分析的技巧。


数据聚合 groupby

groupby 是Pandas中用于对数据进行分组并进行聚合操作的工具。通过groupby,可以将数据按某一列或多列的值进行分组,然后对每组数据进行统计计算,如求和、求平均等。

按类别求和

假设有一个包含商品销售数据的DataFrame,现在希望按商品类别汇总销售额。

import pandas as pd

# 创建示例DataFrame
data = {
    '类别': ['水果', '水果', '蔬菜', '蔬菜', '水果'],
    '销售额': [100, 200, 150, 80, 120]
}
df = pd.DataFrame(data)

# 按类别求和
grouped = df.groupby('类别').sum()

print("按类别汇总销售额:")
print(grouped)

在这个示例中,使用groupby函数按商品类

你可能感兴趣的:(python,数据分析,开发语言)