Python3基础语法04|用Pandas来数据处理(2)

我们接上篇继续讲Pandas~

1.数据表合并

我们在操作数据库使用SQL语言时,会使用连接(JOIN)操作把两个表或多个表连接起来,其中还分为左连接、右连接、内连接、外连接等等。

那我们如何使用Dataframe来进行数据库表的合并呢!

这就引出merge()函数啦~

import pandas as pd
from pandas import DataFrame

df1 = DataFrame({
     'name': ['Alice', 'Bob', 'a', 'b', 'c'], 'data1': range(5)})
df2 = DataFrame({
     'name': ['Alice', 'Bob', 'A', 'B', 'C'], 'data2': range(5)})

# 基于指定列进行连接,保留指定列元素相同的行进行连接
df3 = pd.merge(df1, df2, on='name')
print(df1)
print(df2)
print(df3)

结果:
    name  data1
0  Alice      0
1    Bob      1
2      a      2
3      b      3
4      c      4
    name  data2
0  Alice      0
1    Bob      1
2      A      2
3      B      3
4      C      4
    name  data1  data2
0  Alice      0      0
1    Bob      1      1
# inner内连接
df3 = pd.merge(df1, df2, how='inner')

结果:
    name  data1  data2
0  Alice      0      0
1    Bob      1      1
# left左连接
df3 = pd.merge(df1, df2, how='left')

结果:
    name  data1  data2
0  Alice      0    0.0
1    Bob      1    1.0
2      a      2    NaN
3      b      3    NaN
4      c      4    NaN
# right右连接
df3 = pd.merge(df1, df2, how='right')

结果:
    name  data1  data2
0  Alice    0.0      0
1    Bob    1.0      1
2      A    NaN      2
3      B    NaN      3
4      C    NaN      4
# outer外连接
df3 = pd.merge(df1, df2, how='outer')

结果:
    name  data1  data2
0  Alice    0.0    0.0
1    Bob    1.0    1.0
2      a    2.0    NaN
3      b    3.0    NaN
4      c    4.0    NaN
5      A    NaN    2.0
6      B    NaN    3.0
7      C    NaN    4.0

2.用SQL操作Pandas

Python里是支持用SQL语句来操作Pandas的,这样我们就不用学习额外的操作啦!!

from pandas import DataFrame
from pandasql import sqldf, load_meat, load_births

df1 = DataFrame({
     'name': ['Alice', 'Bob', 'a', 'b', 'c'], 'data1': range(5)})

# lambda 用来定义匿名函数
pysqldf = lambda sql: sqldf(sql, globals())
sql = "select * from df1 where name = 'Alice'"
print(pysqldf(sql))

结果:
    name  data1
0  Alice      0

你可能感兴趣的:(python基础,python,sql,pandas,数据库)