python数据处理-pandas-拼接

python数据处理-pandas-拼接

  • 一:数据拼接方式
    • 1,pd.concat() 、pd.merge()、 Dateframe.join()、pd.append()
    • 2, 区别
    • 二 :pd.concat()
    • 1,源码参数
    • 2, 常用参数解析
      • 1, objs
      • 2, axis
      • 3, join
      • 4,ignore_index
  • 三: Dateframe.join()
    • 1, 常用参数解析
  • 四:pd.append()
    • 1,源码参数
    • 2,常用参数说明:
  • 五:pd.merge()
    • 1,源码参数
    • 2, 常用参数解析
  • 补充
    • 1,循环合并数据
    • 2,dataframe中加入新的行
    • 3. panda 对数据多个sheet的写入
    • 4. python 数据分析之 HTML文件解析

一:数据拼接方式

1,pd.concat() 、pd.merge()、 Dateframe.join()、pd.append()

2, 区别

方法 方法
append 主要用于纵向追加
join 主要用于基于索引的横向合并拼接
concat 最强大,可用于横向和纵向合并拼接
merge 最常用,主要用户基于指定列的横向合并拼接

二 :pd.concat()

cancat是真正的"连接‘’,它把a,b两个表完全拼接在一起,默认拼接形式是并集,我们可以通过修改参数来修改拼接模式,以及拼接方向,也可以重述索引;

1,源码参数

def concat(
    objs: Union[Iterable["NDFrame"], Mapping[Label, "NDFrame"]],
    axis=0,
    join="outer",
    ignore_index: bool = False,
    keys=None, 默认没有
    levels=None,默认没有
    names=None,默认没有
    verify_integrity: bool = False,
    sort: bool = False,
    copy: bool = True)

2, 常用参数解析

1, objs

objs : 传参数据为dataframe 格式,且为Iterable
其中可以是一维数据:Series 二维 :dataframe
例如:

data1 = pd.DataFrame(dict1)
data2 = pd.DataFrame(dict2)
datamerge = pd.concat([data1,data2])
======================
其中datamerge = pd.concat(data1,data2) 就会报错

2, axis

axis : 拼接轴方向,默认为0,沿行拼接;若为1,沿列拼接

3, join

join : 默认外联’outer’,拼接另一轴所有的label,缺失值用NaN填充;内联’inner’,只拼接另一轴相同的label;
outer 模式:

datamerge = pd.concat([data1,data2],axis=0,join='outer')
===========&

你可能感兴趣的:(数据分析,python,pandas)