pandas - merge, concat合并两张表

pandas中合并两张表的函数包括merge,concat。


1. merge

1.1 函数原型

merge(left, right, how='inner', on=None, left_on=None, right_on=None, left_index=False, right_index=False, sort=False, suffixes=('_x','_y'), copy=True)

left代表左边的表;right代表右边的表;how代表连接方式;on代表连接的键。这四个是最主要的参数。其中how可以为:inner, outer, left, right,分别代表:交集,并集,以左边表为基准,以右边表为基准。


1.2 实例

import pandas as pd

df1 = pd.DataFrame([[1,2,3],[5,6,7],[3,9,0],[8,0,3]], columns=["A", "B", "C"])
df2 = pd.DataFrame([[1,2],[4,6],[3,9]], columns=["A", "D"])

""" 
df1 = 
    A	B	C
    1	2	3
    5	6	7
    3	9	0
    8	0	3

df2 = 
    A	D
    1	2
    4	6
    3	9
"""



""" how = "left"
df3 = 
    A	B	C	D
    1	2	3	2.0
    5	6	7	nan
    3	9	0	9.0
    8	0	3	nan
"""
df3 = pd.merge(df1, df2, on="A", how="left")



""" how = "inner"
df3 = 
    A	B	C	D
    1	2	3	2
    3	9	0	9
"""
df3 = pd.merge(df1, df2, on="A", how="inner")

2. concat

concat是直接把多张表拼接在一起,与merge作用很像,但是可以连接多张表;与merge的差别在于,concat不会以某列作为主键来进行连接。

2.1 函数原型

concat(objs,axis=0,join='outer',join_axes=None,ignore_index=False,keys=None,levels=None,names=None,verigy_integrity=False)

你可能感兴趣的:(Python)