pandas中合并两张表的函数包括merge,concat。
1. merge
1.1 函数原型
merge(left, right, how='inner', on=None, left_on=None, right_on=None, left_index=False, right_index=False, sort=False, suffixes=('_x','_y'), copy=True)
left代表左边的表;right代表右边的表;how代表连接方式;on代表连接的键。这四个是最主要的参数。其中how可以为:inner, outer, left, right,分别代表:交集,并集,以左边表为基准,以右边表为基准。
1.2 实例
import pandas as pd
df1 = pd.DataFrame([[1,2,3],[5,6,7],[3,9,0],[8,0,3]], columns=["A", "B", "C"])
df2 = pd.DataFrame([[1,2],[4,6],[3,9]], columns=["A", "D"])
"""
df1 =
A B C
1 2 3
5 6 7
3 9 0
8 0 3
df2 =
A D
1 2
4 6
3 9
"""
""" how = "left"
df3 =
A B C D
1 2 3 2.0
5 6 7 nan
3 9 0 9.0
8 0 3 nan
"""
df3 = pd.merge(df1, df2, on="A", how="left")
""" how = "inner"
df3 =
A B C D
1 2 3 2
3 9 0 9
"""
df3 = pd.merge(df1, df2, on="A", how="inner")
2. concat
concat是直接把多张表拼接在一起,与merge作用很像,但是可以连接多张表;与merge的差别在于,concat不会以某列作为主键来进行连接。
2.1 函数原型
concat(objs,axis=0,join='outer',join_axes=None,ignore_index=False,keys=None,levels=None,names=None,verigy_integrity=False)