SQL开发规范SQL 技巧

一、不能命中索引的 SQL

(1)负向条件查询不能使用索引。
反例: not in/ not exists /!= / <>
select * from order where status!=0 and stauts!=1
可以优化为in查询:select * from order where status in(2,3)
正例: <,<=,=,>,>=,BETWEEN,IN
(2)前导模糊查询不能使用索引。
select * from order where desc like ‘%XX’
而非前导模糊查询则可以:select * from order where desc like ‘XX%’
(3)数据区分度不大的字段不宜使用索引。
select * from user where sex=1原因:性别只有男,女,每次过滤掉的数据很少,不宜使用索引。
经验上,能过滤80%数据时就可以使用索引。
对于订单状态,如果状态值很少,不宜使用索引,如果状态值很多,能够过滤大量数据,则应该建立索引。
(4)在属性上进行计算不能命中索引。
select * from order where YEAR(date) < = ‘2020’
即使date上建立了索引,也会全表扫描
可优化为值计算:select * from order where date < = CURDATE()
select * from order where date < = ‘2020-01-01’
(5)强制类型转换会全表扫描
select * from user where phone=13800001234
你以为会命中phone索引么?大错特错了!!!
(6) 应尽量避免在 WHERE 子句中使用 OR 来连接条件,否则将导致引擎放弃使用索引而进行全表扫描。
使用 OR 的字句可以分解成多个查询,并且通过UNION 连接多个查询。他们的速度只同是否使用索引有关,如果查询需要用到联合索引,用UNION ALL执行的效率更高

二、容易出错的SQL

(1)复合索引最左前缀,并不是指SQL语句的where顺序要和复合索引一致。
用户中心建立了(login_name, passwd)的复合索引
select * from user where login_name=?
select * from user where login_name=? and passwd=?
select * from user where passwd=? and login_name=?都能命中索引,满足复合索引最左前缀。
select * from user where passwd=?不能命中索引,不满足复合索引最左前缀。
(2)允许为null的列,查询有潜在大坑。
单列索引不存null值,复合索引不存全为null的值,如果列允许为null,可能会得到“不符合预期”的结果集。
select * from user where name != ‘shenjian’
如果name允许为null,索引不存储null值,结果集中不会包含这些记录。
所以,请使用not null约束以及默认值。
(3)

三、更优的SQL

(1)如果明确知道只有一条结果返回,limit 1能够提高效率。
select * from user where login_name=?可以优化为:select * from user where login_name=? limit 1
原因:你知道只有一条结果,但数据库并不知道,明确告诉它,让它主动停止游标移动。
(2)把计算放到业务层而不是数据库层,除了节省数据的CPU,还有意想不到的查询缓存优化效果。
select * from order where date < = CURDATE()
这不是一个好的SQL实践,应该优化为: c u r D a t e = d a t e ( ′ Y − m − d ′ ) ; curDate = date('Y-m-d'); curDate=date(Ymd);res = mysql_query( ‘select * from order where date < = $curDate’);画外音:不要问我这是什么语言。原因:释放了数据库的CPU。多次调用,传入的SQL相同,才可以利用查询缓存。
(3)不要使用select *
末了,再加一条,(潜台词,文章的SQL都不合格 =_=),只返回需要的列,能够大大的节省数据传输量,与数据库的内存使用量哟。
(4)使用ENUM而不是字符串。
ENUM保存的是TINYINT,别在枚举中搞一些“中国”“北京”“技术部”这样的字符串,字符串空间又大,效率又低。
(5)如果业务大部分是单条查询,使用Hash索引性能更好,例如用户中心。
select * from user where uid=?
select * from user where login_name=?
原因:B-Tree索引的时间复杂度是O(log(n));Hash索引的时间复杂度是O(1)。
(6)limit 语句优化
在 type, name, create_time 字段上加组合索引
SELECT * FROM operation
WHERE type = ‘SQLStats’ AND name = ‘SlowLog’
ORDER BY create_time
LIMIT 10000, 10;
优化: 可以将上一页的最大值当成参数作为查询条件的。
SELECT * FROM operation
WHERE type = ‘SQLStats’ AND name = ‘SlowLog’
AND create_time > ‘2017-03-16 14:00:00’
ORDER BY create_time
limit 10;

查看更多文章

你可能感兴趣的:(数据库)