使用场景:
批量合并相同格式的Excel、给DataFrame添加行、给DataFrame添加列
一句话说明concat语法:
concat语法:pandas.concat(objs, axis=0, join=‘outer’, ignore_index=False)
append语法:DataFrame.append(other, ignore_index=False)
参考文档:
pandas.concat的api文档:https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.concat.html
pandas.concat的教程:https://pandas.pydata.org/pandas-docs/stable/user_guide/merging.html
pandas.append的api文档:https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.append.html
import pandas as pd
#忽略警告
import warnings
warnings.filterwarnings('ignore')
df1 = pd.DataFrame({'A': ['A0', 'A1', 'A2', 'A3'],
'B': ['B0', 'B1', 'B2', 'B3'],
'C': ['C0', 'C1', 'C2', 'C3'],
'D': ['D0', 'D1', 'D2', 'D3'],
'E': ['E0', 'E1', 'E2', 'E3']
})
df2 = pd.DataFrame({ 'A': ['A4', 'A5', 'A6', 'A7'],
'B': ['B4', 'B5', 'B6', 'B7'],
'C': ['C4', 'C5', 'C6', 'C7'],
'D': ['D4', 'D5', 'D6', 'D7'],
'F': ['F4', 'F5', 'F6', 'F7']
})
pd.concat([df1,df2])#行索引不能忽略
pd.concat([df1,df2], ignore_index=True)#行索引忽略
pd.concat([df1,df2], ignore_index=True, join="inner")
(1)添加一列Series
s1 = pd.Series(list(range(4)), name="F")
pd.concat([df1,s1], axis=1)
(2)添加多列Series
s2 = df1.apply(lambda x:x["A"]+"_GG", axis=1)
s2.name="G"
# 列表可以只有Series
pd.concat([s1,s2], axis=1)
# 列表是可以混合顺序的
pd.concat([s1,df1,s2], axis=1)
df1 = pd.DataFrame([[1, 2], [3, 4]], columns=list('AB'))
df2 = pd.DataFrame([[5, 6], [7, 8]], columns=list('AB'))
df1.append(df2)
df1.append(df2, ignore_index=True)
# 一个空的df
df = pd.DataFrame(columns=['A'])
#低性能版本
for i in range(5):
# 注意这里每次都在复制
df = df.append({'A': i}, ignore_index=True)
# 高性能版本,第一个入参是一个列表,避免了多次复制
pd.concat(
[pd.DataFrame([i], columns=['A']) for i in range(5)],
ignore_index=True
)