数据分析(4)Python科学计算:Pandas

pandas的学习分为以下方面

  • 其中进行数据统计时常用的统计函数如下
  • 数据表合并
    一个DataFrame相当于一个数据库的数据表,多个DataFrame数据表的合并就相当于多个数据库的表合并。
    两个DataFrame数据表的合并使用的是merge()函数,有下面5种形式:
  1. 基于指定列进行连接
  2. inner内连接
  3. left左连接
  4. right右连接
  5. outter外连接

demo:
eg. 创建两个DataFrame:

df1 = DataFrame({
     'name':['ZhangFei', 'GuanYu', 'a', 'b', 'c'], 'data1':range(5)})
df2 = DataFrame({
     'name':['ZhangFei', 'GuanYu', 'A', 'B', 'C'], 'data2':range(5)})

1. 基于指定列进行连接
可以基于 name 这列进行连接

df3 = pd.merge(df1, df2, on='name')

output:
数据分析(4)Python科学计算:Pandas_第1张图片
2. inner 内连接
inner 内链接是 merge 合并的默认情况,inner 内连接其实也就是键的交集,在这里 df1, df2 相同的键是 name,所以是基于 name 字段做的连接:

df3 = pd.merge(df1, df2, how='inner')

output:
数据分析(4)Python科学计算:Pandas_第2张图片
3. left 左连接
左连接是以第一个 DataFrame 为主进行的连接,第二个 DataFrame 作为补充。

df3 = pd.merge(df1, df2, how='left')

output:
数据分析(4)Python科学计算:Pandas_第3张图片
4. right 右连接
右连接是以第二个 DataFrame 为主进行的连接,第一个 DataFrame 作为补充。

df3 = pd.merge(df1, df2, how='right')

output:
数据分析(4)Python科学计算:Pandas_第4张图片
5. outer 外连接
外连接相当于求两个 DataFrame 的并集。

df3 = pd.merge(df1, df2, how='outer')

数据分析(4)Python科学计算:Pandas_第5张图片

你可能感兴趣的:(数据分析)