概述
SQL变更,是我们在开发迭代中不可避免的场景,SQL变更通常是指DDL和DML语句变更,这些sql会影响到数据库表结构或具体数据,变更时如果执行到存在问题的sql脚本,会对实际应用操作难以评估的损失,比如咱们常挂在嘴边的删库跑路。
通常情况下程序员并发故意想“删库跑路”,而是因为种种原因,将存在问题的sql脚本放到了生产环境执行,导致最终出现生产环境数据异常。我们避免异常SQL在生产环境执行的一个有效方式,就是进行SQL变更评审,在评审过程中,我们能将一些有明显缺陷的SQL语句及时拦截,也能凭借评审人的sql经验,把一些不容易发现的问题在评审过程中暴露,进而优化。
sql变更不能完全依赖于评审发现问题,评审只是变更流程中不可获取的一环,评审可以一定程度上防止变更人的疏忽大意以及惯性思维,另外将sql暴露在多个评审人眼前,也容易让问题更容易被发现。sql评审比较依赖于评审人的相关经验,我参与过一些sql评审,故在这里对评审总结的一些经验进行分析,共勉。
以表t_user为例
CREATE TABLE `t_user` (
`id` int(11) NOT NULL AUTO_INCREMENT,
`name` varchar(255) DEFAULT NULL,
`password` varchar(32) DEFAULT NULL,
`role` int(11) DEFAULT NULL,
`creation_date` datetime DEFAULT NULL,
`last_update_date` datetime DEFAULT NULL,
`is_deleted` tinyint(4) DEFAULT '0',
PRIMARY KEY (`id`)
) ENGINE=InnoDB AUTO_INCREMENT=1486021 DEFAULT CHARSET=latin1;
update t_user set `password` = 222 -- 变更人遗忘了where条件
delete from t_user where is_deleted = 'Y'; -- 变更人希望清除标记为已删除的数据
上述update语句,由于“where”条件缺失,将对整张表进行字段“password”字段修改
上述delete语句,变更人希望清除标记为已删除的数据,is_deleted为int类型,值1表示已删除,值0表示未删除,由于变更人把枚举理解为“Y”表示已删除,数值类型与字符串比较时,会进行隐式转换,字符串开头不为数字,会被转换成0,结果执行sql,t_user表将所有未标记删除的数据进行删除。
当执行dml语句,如果表数据量大,同时执行语句覆盖的数据量大,会导致执行时间较长,执行语句行锁时间长,结果导致其他业务操作受到影响。
常见的导致覆盖数据太大的情况有如下几种
1)where条件中,索引失效或未使用到包含索引的字段
由于索引失效,where条件查询满足条件的行,会对全表进行扫描,导致数据库锁表
语句一:
update t_user set `password` = 222 where id + 1 = 2; -- id为主键,但是表达式左侧进行运算导致主键索引失效,查询更新数据时进行了全表扫描
语句二:
update t_user set `password` = 222 where name = "ck"; -- name未添加索引,查询更新数据时全表扫描
语句二,如果实际要修改的数据量不多,几个或者几十个,可将数据先提前查出,记录行数据主键或其中一个具有唯一值且有索引的字段,在原查询条件中添加索引字段条件,可有效缩小范围;实际要修改的数据量较大,可通过建立临时表,临时表存储需要修改数据的唯一索引字段,再通过联表的方式进行索引字段关联,缩小范围。
2)索引未失效,但仍进行了全表扫描
update t_user set `password` = 222 where id in (select id from t_user_id); -- 全表扫描,update时,每行数据都会进行in select操作
在查询时,这种写法会用到索引,select id from t_user_id 也只会执行1次
每次每行语句都会执行 select id from t_user_id,因此进行了全表扫描,可将语句改为联表操作,数据范围即可缩小
修改后:
update t_user u join t_user_id ui on u.id = ui.id set `password` = 222;
3)exist 引入的异常sql
delete from t_user where EXISTS (select 1 from t_user_id ui where ui.id = id); --将进行全表数据删除
t_user 与t_user_id表中都有id字段,exists中就近取t_user_id表的id字段,ui.id = id 恒成立
在删除sql中,exists中的语句不能医用被删除表的中字段,最终写出来能执行的sql,但是却是全表删除
建议delete语句和update语句使用exists时不要使用这类写法。
修改为联表方式
delete t_user, t_user_id from t_user join t_user_id on t_user.id = t_user_id.id
修改备注时不会进行锁表,无需担心锁表
1)此类操作,需考虑表数据量大小,若数据量小于百万级别
执行数据较快,一般不影响业务
2)在百万级别以上,这类修改字段设计到表结构变化,会导致表锁定,应避免在高负载时进行此类操作,以免影响系统性能
3)百万级别以上建议用一下方式修改表字段
a、创建一个新的临时表
b、执行修改表字段操作
c、将原始数据插入临时表,并记录此时时间
b、原始表表名修改,临时表修改为原始表名
e、检查在复制数据阶段,原来的原始表是否有数据更新和插入(根据记录的时间查询),有更新则在新表中同步更新
三、数据备份及数据清理
我们都希望变更执行成功,不会有回退的时候,但为了避免回退时数据丢失难以恢复,有必要进行数据的备份处理;另外长期使用数据库,数据库中难免会有一些空间碎片,为避免存储空间浪费,需要定期进行数据清理;
1、数据备份
1)数据更新或数据删除
将需要修改或需要删除的数据,复制到临时表进行备份,备份表名最好统一格式,便于区分用途和备份时间
2)新增数据无需备份
2、数据清理
1)OPTIMIZE TABLE
OPTIMIZE TABLE 进行碎片整理,由于会锁表,应避免在高负载时进行此类操作,以免影响系统性能
默认会记录binlog,如果不想记录binlog,添加local参数,即 OPTIMIZE local TABLE
2)其他清理表方式
OPTIMIZE TABLE执行时间较长时,不可避免影响业务,此时可以参考修改表字段时的操作
a、创建一个新的临时表
b、执行修改表字段操作
c、将原始数据插入临时表,并记录此时时间
b、原始表表名修改,临时表修改为原始表名
e、检查在复制数据阶段,原来的原始表是否有数据更新和插入(根据记录的时间查询),有更新则在新表中同步更新
f、原来需要清理数据的表,进行表删除
最后
sql变更,不可能全靠sql评审规避所有问题,变更人仍需遵守规范,同时重视sql,在上生产前,充分做好测试,测试环境执行测试几乎能规避全部问题,数据写操作时,修改为查询语句,可检测数据范围,让sql在有充分把握,再去生产执行。