作为数据分析师,掌握一门数据库语言,是很有必要的。
今天黄同学就带着大家学习两个关系型数据库MySQL、Oracle,了解一个非关系数据库MongoDB。
1. Python操作Oracle数据库
这一部分的难点在于:环境配置有点繁琐。不用担心,我为大家写了一篇关于Oracle环境配置的文章。
Python操作Oracle使用的是cx_Oracle库。需要我们使用如下命令提前安装:
pip insatll cx_Oracle
① Python链接Oracle服务器的3种方式
# ① 用户名、密码和监听写在一起 import cx_Oracle db = cx_Oracle.connect('scott/a123456@DESKTOP-V4LKB10:1521/orcl') # ② 用户名、密码和监听分开写 import cx_Oracle db = cx_Oracle.connect("scott","a123456","192.168.2.1:1521/orcl") # ③ 配置监听并连接 import cx_Oracle moniter = cx_Oracle.makedsn('192.168.2.1',1521,'orcl') db = cx_Oracle.connect('scott','a123456',moniter)
② Python怎么获取Oracle中的数据?
这里有三种常用的方法,分别为大家进行介绍。
Ⅰ fetchone():一次获取一条记录;
import cx_Oracle # 注意:一定要加下面这两行代码,负责会中文乱码; import os os.environ['NLS_LANG'] = 'SIMPLIFIED CHINESE_CHINA.UTF8' db = cx_Oracle.connect("scott","a123456","192.168.2.1:1521/orcl") cursor = db.cursor() cursor.execute('select count(*) from emp1') aa = cursor.fetchone() print(aa) cursor.execute('select ename,deptno,sal from emp1') for i in range(aa[0]): a,b,c = cursor.fetchone() d = "我的名字叫{},所在部门是{},工资是{}美元".format(a,b,c) display(d) db.close()
结果如下:
Ⅱ fetchall():一次获取所有记录;
import cx_Oracle # 注意:一定要加下面这两行代码,负责会中文乱码; import os os.environ['NLS_LANG'] = 'SIMPLIFIED CHINESE_CHINA.UTF8' db = cx_Oracle.connect("scott","a123456","192.168.2.1:1521/orcl") cursor = db.cursor() cursor.execute('select ename,deptno,sal from emp1') aa = cursor.fetchall() # print(aa) for a,b,c in aa: d = "我的名字叫{},所在部门是{},工资是{}美元".format(a,b,c) display(d) db.close()
结果如下:
Ⅲ 使用pandas中的read_sql()方法,将提取到的数据直接转化为DataFrame进行操作;
import cx_Oracle import pandas as pd import os os.environ['NLS_LANG'] = 'SIMPLIFIED CHINESE_CHINA.UTF8' db = cx_Oracle.connect("scott","a123456","192.168.2.1:1521/orcl") cursor = db.cursor() df1 = pd.read_sql("select * from emp where deptno=20",db) display(df1) df2 = pd.read_sql("select * from emp where deptno=30",db) display(df2)
结果如下:
2. Python操作MySQL数据库
MySQL数据库应该是国内应用最多的数据库。大多数公司一般都是使用的该数据库。这也就是很多学生在毕业之前都会选择学习该数据库知识,用于面试。
Python操作MySQL使用的是cx_Oracle库。需要我们使用如下命令提前安装:
pip insatll pymysql
更多细节参考:Python操作Oracle详解!
① Python链接MySQL服务器
import pymysql db = pymysql.connect(host='localhost',user='root',password='123456',port=3306,db='spiders',charset=' utf8')
这里面有六个参数,需要为大家一一介绍一下:
参数host:mysql服务器所在的主机的ip;
参数user:用户名;
参数password:密码;
参数port:连接的mysql主机的端口,默认是3306;
参数db:连接的数据库名;
参数charset:当读取数据出现中文会乱码的时候,需要我们设置一下编码;我们使用python操作数据库的时候,那么python就相当于是client,我们是用这个client来操作mysql的server服务器,python3默认采用的utf8字符集,我的mysql服务器默认采用latin1字符集,因此mysql中创建的每张表,都是建表的时候加了utf8编码的,因此这里设置的应该就是connection连接器的编码;
② Python怎么获取MySQL中的数据?
Ⅰ fetchone():一次获取一条记录;
import pymysql db = pymysql.connect(host='localhost',user='root',db='huangwei',password='123456',port=3306,charset='utf8') cursor = db.cursor() cursor.execute('select count(*) from person') aa = cursor.fetchone() print(aa) cursor.execute('select name,age from person') for i in range(aa[0]): a,b = cursor.fetchone() c = "我的名字叫{},今年{}岁".format(a,b) display(c) db.close()
结果如下:
Ⅱ fetchall():一次获取所有记录;
import pymysql db = pymysql.connect(host='localhost',user='root',db='huangwei',password='123456',port=3306,charset='utf8') cursor = db.cursor() cursor.execute('select name,age from person') aa = cursor.fetchall() # print(aa) for a,b in aa: c = "我的名字叫{},今年{}岁".format(a,b) display(c) db.close()
结果如下:
Ⅲ 使用pandas中的read_sql()方法,将提取到的数据直接转化为DataFrame进行操作;
import pymysql import pandas as pd db = pymysql.connect(host='localhost',user='root',db='huangwei',password='123456',port=3306,charset='utf8') cursor = db.cursor() df1 = pd.read_sql("select * from student where ssex='男'",db) display(df1) df2 = pd.read_sql("select * from student where ssex='女'",db) display(df2)
结果如下:
3. Python操作MongoDB数据库
这一部分主要带大家对比学习:关系型数据和非关系型数据库的不同之处。咱们了解一下即可,不必过深研究,因为数据分析师基本不会使用这种数据库。
Python操作MongoDB使用的是pymongo库。需要我们使用如下命令提前安装:
pip insatll pymongo
更多细节参考:Python操作MongoDB详解!
① Python链接MongoDB服务器
from pymongo import MongoClient conn = MongoClient("localhost",27017)
② Python怎么获取MongoDB中的数据?
Ⅰ 查询部分文档;
res = collection.find({"age": {"$gte": 19}}) for row in res: print(row)
Ⅱ 查询所有文档;
res = collection.find() for row in res: print(row)
Ⅲ 统计查询;
res = collection.find().count() print(res)
Ⅳ 根据 id 查询;
这里需要引入第三方库。
from bson.objectid import ObjectId res = collection.find({"_id":ObjectId("5cc506289e1d88c95465488e")}) print(res[0])
Ⅴ 升序排序;
res = collection.find().sort("age") for row in res: print(row)
Ⅵ 降序排序;
这里也需要引入第三方库。
import pymongo res = collection.find().sort("age",pymongo.DESCENDING) for row in res: print(row)
Ⅶ 分页查询
res = collection.find().limit(3).skip(5) for row in res: print(row)
以上就是Python操作MySQL MongoDB Oracle三大数据库深入对比的详细内容,更多关于Python操作MySQL MongoDB Oracle对比的资料请关注脚本之家其它相关文章!