由于merge函数是可以将两个表进行合并,如果多余两个表进行合并的话,可以使用merge嵌套的方法,当然也可以用reduce和merge组合的方法来实现。
例如,以下代码:
from functools import reduce
import pandas as pd
df1 = pd.DataFrame({'key': ['K0', 'K1', 'K2', 'K3'],
'A': ['A0', 'A1', 'A2', 'A3'],
'B': ['B0', 'B1', 'B2', 'B3']})
df2 = pd.DataFrame({'key': ['K0', 'K1', 'K2', 'K3'],
'C': ['C0', 'C1', 'C2', 'C3'],
'D': ['D0', 'D1', 'D2', 'D3']})
df3 = pd.DataFrame({'key': ['K0', 'K1', 'K2', 'K3'],
'E': ['E0', 'E1', 'E2', 'E3'],
'F': ['F0', 'F1', 'F2', 'F3']})
dfs = [df1,df2,df3]
df_final = reduce(lambda left,right: pd.merge(left,right,how='outer',on="key"), dfs)
df_final
reduce()函数是functools模块中的一个函数,其作用是对参数序列中元素进行累积,返回值是一个数值。
# 关于reduce的使用
from functools import reduce
# 将列表里面整数累加
list_p = [1,2,3]
re = reduce(lambda x,y:x+y,list_p)
print(re)