最近项目当中一直没有注意数据库连接池的问题
今天查了些资料。做一个小总结
从程序当中看连接
-
Engine Configuration
Engine
是访问数据库的入口,Engine
引用Connection Pool
和 Dialect
实现了对数据库的访问, Dialect
指定了具体的数据库类型 MYSQL, SQLSERVER
等, 三者关系如图所示:
只有当调用connect(),execute()
函数的时候,才会创建数据库的连接
create_engine
使用 create_engine
创建我们需要的DB starting point
from sqlalchemy import create_engine
scheme = 'mysql+pymysql://root:123456@localhost:3306/dev_shopping?charset=utf8'
engine = create_engine(scheme, pool_size=10 , max_overflow=-1, pool_recycle=1200)
create_engine
函数常用参数:
pool_size=10 # 连接池的大小,0表示连接数无限制
pool_recycle=-1 # 连接池回收连接的时间,如果设置为-1,表示没有no timeout, 注意,mysql会自动断开超过8小时的连接,所以sqlalchemy沿用被mysql断开的连接会抛出MySQL has gone away
max_overflow=-1 # 连接池中允许‘溢出’的连接个数,如果设置为-1,表示连接池中可以创建任意数量的连接
pool_timeout=30 # 在连接池获取一个空闲连接等待的时间
echo=False # 如果设置True, Engine将会记录所有的日志,日志默认会输出到sys.stdout
创建Engine
之后,接下来的问题,就是如何使用Engine
在单进程中,建议在在初始化的模块的时候创建Engine
, 使Engine
成为全局变量, 而不是为每个调用Engine
的对象或者函数中创建, Engine
不同于connect
, connect
函数会创建数据库连接的资源,Engine
是管理connect
创建的连接资源
在多进程中,为每个子进程都创建各自的Engine
, 因为进程之间是不能共享Engine
connect
使用connect
创建连接数据库资源, 如上所说,即使创建了Engine
, 还是没有创建对数据库的连接,调用connect
才会创建真正的连接
connection = engine.connect()
result = connection.execute("select * from tmp")
print type(result) #
for row in result:
print "target_name:", row['target_name']
connection.close()
这里有两个问题需要搞清楚,result
返回对象类型和对象提供的方法,第二个是close
函数调用之后,发生了什么事情,先说close
close
当调用connection.close()
之后,由connect
函数创建的连接会被释放到连接池中, 可以供下次使用.
上面这段代码可以简写为:
result = engine.execute("select username from users")
for row in result:
print "username:", row['username']
execute
函数会创建自己的连接,并执行声明的sql语句,返回ResultProxy
对象,在这个情况下,ResultProxy
会有个标记close_with_result
, 如果ResultProxy
的值被全部取出来,Engine
会自动close
本次连接,并把连接释放到连接池里面去
如果ResultProxy
里面还有数据没有取出来(rows remaining),可使用result.close()
释放本次连接,如果没有使用result.close()
释放连接,python garbage collection
最终为释放本次连接到连接池中
ResultProxy
现在来看一下execute()
执行之后返回的结果类型 详细文档。
常用的API如下:
fetchone() 取出一行, 当所有的行被取出来之后 connect resource会被释放到连接池中,再次调用fetchone()将返回None
result = connection.execute("select * from tmp")
row = result.fetchone()
print row[0] # access via integer position
print row['id'] # access via name
print type(row) #
# 类似还有
first() 获取第一行,同时无条件的释放连接
scalar() 获取第一行第一列的数据,同时无条件的释放连接
rowcount 获取row count
lastrowid 使用insert()方法的时候,获取最后一行的id
连接池
在这种情况下,当你使用了session后就算显式地调用session.close(),也不能把连接关闭。连接会由QueuePool连接池进行管理并复用。
从mysql角度看连接
- mysql查看当前连接数的命令是 show processlist;
show processlist;查看正在运行的线程,列出前100条
show full processlist;列出所有。
+--------+-------------+-------------+---------+-------------+---------+------------------------------------------
| Id | User | Host | db | Command | Time | State | Info | Progress
+--------+-------------+-------------+---------+-------------+---------+------------------------------------------
Id 标识,kill某个mysql线程时使用
User 显示当前用户,如果不是root,那么就只显示授权范围内的sql语句的用户
host 显示sql语句是从哪个ip,哪个端口发出的,可以用来追踪出问题的用户和端口
db 显示该线程连接的是哪个数据库
command 显示当前执行的命令,
一般:sleep 休眠,query 查询,connect 连接。
time 状态持续时间,单位秒
state 显示使用当前连接的sql语句的状态,很重要列。请注意,state只是语句执行中的某一个状态。以查询为例,需要经过copying to tmp table,sorting result,sending data等状态才算完成。
info 显示这个sql语句,判断问题的重要依据。
最关键的参数就是state列,状态主要有:
Checking table
正在检查数据表(这是自动的)。
Closing tables
正在将表中修改的数据刷新到磁盘中,同时正在关闭已经用完的表。这是一个很快的操作,如果不是这样的话,就应该确认磁盘空间是否已经满了或者磁盘是否正处于重负中。
Connect Out
复制从服务器正在连接主服务器。
Copying to tmp table on disk
由于临时结果集大于tmp_table_size,正在将临时表从内存存储转为磁盘存储以此节省内存。
Creating tmp table
正在创建临时表以存放部分查询结果。
deleting from main table
服务器正在执行多表删除中的第一部分,刚删除第一个表。
deleting from reference tables
服务器正在执行多表删除中的第二部分,正在删除其他表的记录。
Flushing tables
正在执行FLUSH TABLES,等待其他线程关闭数据表。
Killed
发送了一个kill请求给某线程,那么这个线程将会检查kill标志位,同时会放弃下一个kill请求。MySQL会在每次的主循环中检查kill标志位,不过有些情况下该线程可能会过一小段才能死掉。如果该线程程被其他线程锁住了,那么kill请求会在锁释放时马上生效。
Locked
被其他查询锁住了。
Sending data
正在处理SELECT查询的记录,同时正在把结果发送给客户端。
Sorting for group
正在为GROUP BY做排序。
Sorting for order
正在为ORDER BY做排序。
Opening tables
这个过程应该会很快,除非受到其他因素的干扰。例如,在执ALTER TABLE或LOCK TABLE语句行完以前,数据表无法被其他线程打开。正尝试打开一个表。
Removing duplicates
正在执行一个SELECT DISTINCT方式的查询,但是MySQL无法在前一个阶段优化掉那些重复的记录。因此,MySQL需要再次去掉重复的记录,然后再把结果发送给客户端。
Reopen table
获得了对一个表的锁,但是必须在表结构修改之后才能获得这个锁。已经释放锁,关闭数据表,正尝试重新打开数据表。
Repair by sorting
修复指令正在排序以创建索引。
Repair with keycache
修复指令正在利用索引缓存一个一个地创建新索引。它会比Repair by sorting慢些。
Searching rows for update
正在讲符合条件的记录找出来以备更新。它必须在UPDATE要修改相关的记录之前就完成了。
Sleeping
正在等待客户端发送新请求.
System lock
正在等待取得一个外部的系统锁。如果当前没有运行多个mysqld服务器同时请求同一个表,那么可以通过增加--skip-external-locking参数来禁止外部系统锁。
Upgrading lock
INSERT DELAYED正在尝试取得一个锁表以插入新记录。
Updating
正在搜索匹配的记录,并且修改它们。
User Lock
正在等待GET_LOCK()。
Waiting for tables
这个是我经常会遇到的,意思是该线程得到通知,数据表结构已经被修改了,需要重新打开数据表以取得新的结构。然后,为了能的重新打开数据表,必须等到所有其他线程关闭这个表。以下几种情况下会产生这个通知:FLUSH TABLES tbl_name, ALTER TABLE, RENAME TABLE, REPAIR TABLE, ANALYZE TABLE,或OPTIMIZE TABLE。
waiting for handler insert
INSERT DELAYED已经处理完了所有待处理的插入操作,正在等待新的请求。
大部分状态对应很快的操作,只要有一个线程保持同一个状态好几秒钟,那么可能是有问题发生了,需要检查一下。