前提条件:本地已经安装好oracle单实例,能使用plsql developer连接,或者能使用TNS连接串远程连接到oracle集群
读取excel写入数据库的方式有多种,这里介绍的是使用pandas写入,相对来说比较简便,不需要在读取excel后再去整理数据
整个过程需要分两步进行:
网上有不少教程,但大部分都没那么详细,并且也没有说明连接单实例和连接集群的区别,这里先介绍连接oracle单实例的方式,后续再补充连接oracle集群方式。
版本:
window 10 64位
python 3.6.8
cx-Oracle 7.3.0
安装流程:
pip install cx_Oracle==7.3.0
注意这里电脑是64位的,使用的即时客户端也是64位的,32位的需要另外到下面的下载地址找一下
链接:https://pan.baidu.com/s/1ARcdK8kgNKfQsNbP5ZEbKg
提取码:lz0g
oracle即时客户端使用说明:
https://docs.oracle.com/en/database/oracle/oracle-database/19/lnoci/instant-client.html#GUID-6895DB45-97AA-4738-9959-BD677D610186
oracle即时客户端下载地址:
https://www.oracle.com/database/technologies/instant-client/downloads.html
虽然导入cx_Oracle有红色波浪线,一般认为导入不成功,但这里可以先不管它,直接运行测试代码,没有报错说明没问题。
如果没有查到数据,也可能是该用户下没有emp表。
import cx_Oracle
import os
# 设置环境编码方式,可解决读取数据库中文乱码问题
os.environ['NLS_LANG'] = 'SIMPLIFIED CHINESE_CHINA.UTF8'
# 用户名/密码@IP:端口/实例名
conn = cx_Oracle.connect('kplin/[email protected]:1521/ORCL')
cursor = conn.cursor()
try:
sql = 'select * from emp'
cursor.execute(sql)
ret = cursor.fetchall()
print(ret)
# cursor.commit()
except Exception as e:
print(e)
finally:
cursor.close()
这里指定pandas版本是因为最新版的pandas在读写excel的时候会有些奇怪的报错,换成1.1.4版本即可。
pip install pandas==1.1.4
pip install sqlalchemy
#!/usr/bin/env python
# -*- coding:utf-8 -*-
# date: 2021/3/14
# filename: excel_to_db
# author: kplin
import pandas as pd
from sqlalchemy import create_engine
from sqlalchemy import types
# conn_string='oracle+cx_oracle://user:pass@host:port/dbname'
conn_string='oracle+cx_oracle://KPLIN:[email protected]:1521/ORCL'
engine = create_engine(conn_string, echo=False)
df = pd.read_excel('test.xlsx')
# if_exists有三个可选值,'fail':如果存在该表则报错,'append':如果存在该表则将数据追加到列尾,'replace':如果存在该表则替换
# df.to_sql('test', con=engine, if_exists='replace')
# 按上面这种写入方式name字段将被写成clob字段类型,
# 如果我们希望把name改为varchar2类型,怎么做?
# 我们可以利用sqlalchemy的types把name指定为varchar2()类型
len = df.name.str.len().max()
df.to_sql('test', engine, if_exists='replace', dtype={
'name': types.VARCHAR(len)})
rows = engine.execute("SELECT * FROM TEST").fetchall()
print(rows)