个人简介:一个从会计转行数据分析师的三旬老汉
擅长领域:数据分析、数据仓库、大数据
博客内容:平时会将自己工作中遇到的问题进行归纳总结,分享给各位小伙伴,意在帮助大家少加班、不掉发,让我们相互学习,一起进步。
本文分享使用Python操作PostgreSQL数据库的基本方法,包括数据库连接、增、删、改、查,供各位小伙伴参考。
操作MySQL数据库主要使用psycopg2包,连接PostgreSQL数据库的语法为connect(IP, 端口, 用户名, 密码, 数据库名,编码格式)。具体代码如下:
import psycopg2
conn = psycopg2.connect(
host='xxx',
port='xxx',
dbname='xxx',
user='xxx',
password='xxx'
)
以下语法中1、2、4、5为操作数据库的通用语法,下文其他步骤也会使用。
import psycopg2
conn = psycopg2.connect(
host='xxx',
port='xxx',
dbname='xxx',
user='xxx',
password='xxx'
)
cursor = conn.cursor()
# 建表
create_sql = """
CREATE TABLE xxx.yyy(
id int
,name varchar(10)
);
"""
cursor.execute(create_sql)
print("create successfully")
conn.commit()
conn.close()
import psycopg2
conn = psycopg2.connect(
host='xxx',
port='xxx',
dbname='xxx',
user='xxx',
password='xxx'
)
cursor = conn.cursor()
# 插入
insert_sql = "INSERT INTO xx.yyy (id, name) VALUES (%s, '%s')" % (1, '张三')
cursor.execute(insert_sql)
print("insert successfully")
conn.commit()
conn.close()
import psycopg2
conn = psycopg2.connect(
host='xxx',
port='xxx',
dbname='xxx',
user='xxx',
password='xxx'
)
cursor = conn.cursor()
# 插入
insert_sql = """
DROP TABLE IF EXISTS xx.yyy;
CREATE TABLE IF NOT EXISTS xx.yyy AS
SELECT
aa
,bb
FROM xx.yyy
"""
cursor.execute(insert_sql)
print("insert successfully")
conn.commit()
conn.close()
直接删除表数据和表结构,其语法和SQL删表语法一致。具体代码如下:
import psycopg2
conn = psycopg2.connect(
host='xxx',
port='xxx',
dbname='xxx',
user='xxx',
password='xxx'
)
cursor = conn.cursor()
# 删表
cursor.execute("DROP TABLE IF EXISTS xx.yyy")
conn.commit()
conn.close()
只删除数据,不删除表结构。其语法和SQL删表数据语法一致。具体代码如下:
import psycopg2
conn = psycopg2.connect(
host='xxx',
port='xxx',
dbname='xxx',
user='xxx',
password='xxx'
)
cursor = conn.cursor()
# 删表数据
cursor.execute("TRUCATE TABLE xx.yyy")
conn.commit()
conn.close()
将上文所建的yyy表中,“张三”改为“何老六”。具体代码如下:
import psycopg2
conn = psycopg2.connect(
host='xxx',
port='xxx',
dbname='xxx',
user='xxx',
password='xxx'
)
cursor = conn.cursor()
cursor.execute("UPDATE xx.yyy SET name = '何老六' WHERE id = 1")
conn.commit()
conn.close()
直接使用pandas包查询数据库表,语法为read_sql(“select xxx from yyy”, con=数据库连接)。
import psycopg2
import pandas as pd
conn = psycopg2.connect(
host='xxx',
port='xxx',
dbname='xxx',
user='xxx',
password='xxx'
)
df = pd.read_sql("select * from xx.yyy limit 100;", con=conn)
print(df)
除了PostgreSQL数据库外,业界常用的数据库MySQL也可以使用Python进行操作,具体情况可参考作者的另一篇博客Python操作MySQL数据库。