python transform方法_transform函数(来自Python Pandas)的初步应用

简介

Pandas(Python)中的transform函数一开始可能有点难以理解,并且大多数数据科学家不会马上使用到它。 但对于数据科学家来说,transform函数是一个用于数据清洗、转换或者生成报表的非常方便的工具,尤其是对于大量数据的处理速度上。

应用实例

考虑这样一个例子,我们有来自某商店的表格如下:某商店的销售数据

而我们希望生成一个新列,统计每个用户的平均购买额,如下:我们希望生成的表

我们起码有两种方法实现这个操作:先采用groupby计算平均并生成一个新的dataframe,再和上一个dataframe进行merge

采用transform函数

第一种方法:

import pandas as pd

# 读取数据

df=pd.read_csv(“purchase.csv”)

# 1.生成新的dataframe,计算mean

mean_purchase =df.groupby('User_ID')["Purchase"].mean().rename("User_mean").reset_index()

# 2.和上一步的dataframe合并

df_1 = df.merge(mean_purchase)

第二种方法:

# 直接使用transform函数

df["User_Mean"] = df.groupby('User_ID')["Purcha

你可能感兴趣的:(python,transform方法)