[python]使用 Pandas 分组和汇总表数据

在数据分析中,数据的分组与汇总是非常常见的操作。下面使用 Python 的 Pandas 库来处理表数据,并生成汇总结果。

导入数据

首先,我们需要导入必要的库并读取 Excel 文件中的数据:

import pandas as pd

# 读取工资表数据
df = pd.read_excel('输入.xlsx')

假设我们的表数据如下所示:

姓名 基础1 基础2 其他
张三 5000 2000 1000
李四 6000 2500 1200
王五 4500 2200 900
张三 5200 2100 1050
李四 6100 2600 1250
分组与汇总

接下来,我们将按照姓名进行分组,并对各类数据进行合计:

# 按照姓名分组并合计各类工资
df_grouped = df.groupby('姓名')[["基础1", "基础2", "其他"]].sum()

汇总后的数据如下:

姓名 基础1 基础2 其他
张三 10200 4100 2050
李四 12100 5100 2450
王五 4500 2200 900
导出结果

最后将汇总后的数据导出到一个新的 Excel 文件中:

# 导出合并后的结果到新的 Excel 文件
df_grouped.to_excel('salary_summary.xlsx', index=True)
# index=True 会保留姓名列作为索引
print("结果已成功导出到 'salary_summary.xlsx'.")

你可能感兴趣的:(Python,python,pandas,开发语言)