pandas数据合并

一、concat()合并

1、参数

(1)pd.concat()沿一个轴将多个DataFrame对象连结在一起

(2)axis参数,0表示x轴,1表示y轴。

(3)join参数,outer并集,inner交集。

2、纵向并集

df3=pd.concat([df1,df2],axis=0,join='outer') #缺失值用NAN填充,保留原数据的行索引。

如果创建df1和df2时,index没有实际含义,可以添加一个参数ignore_index=Ture来重新定义一个新的index。

df4=pd.concat([df1,df2],axis=0,join='outer',ignore_index=Ture)

3、纵向交集

df4=pd.concat([df1,df2],axis=0,join='inner',ignore_index=Ture)

二、merge()合并

1、参数

(1)pd.merge()方法通过指定连接键拼接列数据。

(2)how参数指的是连接方式:inner(默认),outer,left,right

(3)on参数指的是用于连接的列索引名称:必须存在于两个DataFrame中。如果没有指定,则以两个

2、并集例子,以两个DataFrame的键值所有值作为该列的值

pd.merge(df1,df2,how='outer',on=['键值']) #注意,on的参数是列表格式,缺失的值用NAN填充。

3、left例子,以左侧的DataFrame的键值作为该列的值

pd.merge(df1,df2,how='left',on=['键值']) #注意,on的参数是列表格式,缺失的值用NAN填充。

你可能感兴趣的:(pandas数据合并)