Dateframe合并方式总结

  1. concat函数:

    • 功能:按行或按列合并两个或多个DataFrame。
    • 合并方向:纵向合并(按行)或横向合并(按列)。
    • 使用方法:pd.concat([df1, df2], axis=0)(纵向合并)或 pd.concat([df1, df2], axis=1)(横向合并)。
    • 优点:简单直观,不需要指定合并的列。
  2. merge函数:

    • 功能:基于共同的列值合并两个DataFrame。
    • 合并方式:内连接、外连接、左连接、右连接等。
    • 使用方法:pd.merge(df1, df2, on='common_column', how='inner')
    • 优点:可以根据共同的列值灵活地选择合并方式。
  3. join函数:

    • 功能:基于索引或列来合并两个DataFrame。
    • 合并方式:默认为左连接。
    • 使用方法:df1.join(df2)(基于索引)或 df1.join(df2, on='common_column')(基于列)。
    • 优点:方便基于索引或列合并DataFrame。
  4. append函数:

    • 功能:在一个DataFrame的末尾追加另一个DataFrame,纵向合并。
    • 使用方法:df1.append(df2, ignore_index=True)
    • 优点:简单快捷,适用于简单的纵向合并。
  5. combine_first函数:

    • 功能:将一个DataFrame中的缺失值用另一个DataFrame中的非缺失值进行填充。
    • 使用方法:df1.combine_first(df2)
    • 优点:处理缺失值的常用方法,有效填充缺失数据。

你可能感兴趣的:(数据挖掘)