作为一名优秀的码农,对于了解Sql如何调优是很有必要的。。简单总结一下,
1.对查询进行优化,应尽量避免全表扫描,首先应考虑在 where 及 order by 涉及的列上建立索引(单表索引不能超过六个)
2.使用更多的条件,缩小查找范围
3.使用关联时,用小结果集驱动大结果集
(ps:下面的语句推荐给司机们,赶快上车)
--EXPLAIN:表示打出某sql的执行计划,看看是否走了全表,ANALYZE: 表示需要消耗的时间耗时,
EXPLAIN ANALYZE SELECT id,a FROM A;
下面是我日常用到的一些Sql优化点,大家可以借鉴一下
返回了不必有的数据,就会浪费内存,加重网络的负担降低性能 。如果表大,在表扫描的期间将表锁住,禁止其他的链接访问表,后果严重!!
--correct SQL
SELECT * FROM A;
--error SQL
SELECT id FROM A WHERE create_time >'2019-1-1';
若在关键词abc前面用了“%”,会导致该Sql走全表查询,除非必要,否则不要在关键词前加%
ps: 查询耗时和字段值总长度成正比
--error SQL
SELECT id FROM A WHERE name LIKE '%abc%';
--correct SQL
SELECT id FROM A WHERE name LIKE 'abc%';
该判断将导致引擎放弃使用索引而进行全表扫描,建议针对null字段设置默认值0
--error SQL
SELECT id FROM A WHERE a ISNULL;
SELECT id FROM A WHERE a NOTNULL;
--correct SQL 可以在a上设置默认值0,确保表中a列没有null值
SELECT id FROM A WHERE a =0;
SELECT id FROM A WHERE a >0;
该判断将导致引擎放弃使用索引而进行全表扫描,建议将不等于 拆成 大于或者小于
--error SQL
SELECT id FROM A WHERE a !=2017;
--correct SQL
SELECT id FROM A WHERE a >2017 OR a <2017;
使用or的子句可以分解成多个查询,并且通过union链接多个查询。它们的速度只同是否使用索引有关,如果查询使用到联合索引,用unionAll执行的效率更高,多个or字段的字句没有用到索引,改写成union的形式,再视图与索引匹配
--error SQL
SELECT id FROM A WHERE a >2017 OR a <2017;
--correct SQL
SELECT id FROM A WHERE a >2017
UNION ALL
SELECT id FROM A WHERE a <2017;
NOT IN sql执行时,会转成 <> 将导致引擎放弃使用索引而进行全表扫描,不推荐使用NOT IN
IN 也会使系统无法使用索引,而只能直接搜索表中的数据(ps:如果一定要使用in 注意在in后面值的列表中,将出现最频繁的值放在最前面,出现的最少的放在最后面,减少判断的次数)
--error SQL
SELECT id FROM A WHERE a IN (2017,2018,2019);
SELECT id FROM A WHERE a IN (SELECT id FROM B);
--correct SQL 如果查询的是连续的值,可以使用BETWEEN AND 函数
SELECT id FROM A WHERE a BETWEEN 2017 AND 2019
--correct SQL 如果只是IN中的子表结果集比较大,建议使用 EXISTS
SELECT id FROM A WHERE EXISTS (SELECT 1 FROM B WHERE B.id=a)
IN 是在内存中比较的,只执行一次,把B表中的所有id字段缓存起来,之后检查A表的id是否与B表中的id相等,如果id相等则将A表的记录加入到结果集中,直到遍历完A表的所有记录
EXISTS 需要查询数据库,所以当B的数据量比较大时,EXISTS效率优于IN
--error SQL
SELECT id FROM A WHERE a IN (SELECT id FROM B);
--correct SQL
SELECT id FROM A WHERE EXISTS (SELECT 1 FROM B WHERE B.id=a)
--correct SQL 如果只是IN子表查询结果,建议使用 EXISTS
SELECT id FROM A WHERE EXISTS (SELECT 1 FROM B WHERE B.id=a)
在where子句中的“=”左边进行函数、算数运算或其他表达式运算,系统可能无法正确的使用索引
--error SQL
SELECT * FROM A WHERE a/2=100;
SELECT * FROM A WHERE SUBSTRING(a,1,4)=’6666’;
--correct SQL
SELECT * FROM A WHERE a=100*2;
SELECT * FROM A WHERE a LIKE ’6666%’;
它会使查询变慢,这些动作可以改在客户端执行也可以
如果能在group by的having字句之前就能剔除多余的行,所以尽量不要用他们来做剔除行的动作。最优执行顺序:select 的where字句选择所有合适的行,group用来分组统计,having用于剔除多余的分组。这样group by和having的开销小,查询快。对于大的数据进行分组和having十分消耗资源。如果group by的目的不包括计算,只是分组。Distinct更快
因为inner join是等值连接,或许返回的行数比较少.提倡使用内联INNER JOIN
UNION在进行表链接后会筛选掉重复的记录,UNION ALL不会去除重复记录
UNION将会按照字段的顺序进行排序,UNION ALL只是简单的将两个结果合并后就返回
意思就是使用批处理更有效率
--error SQL
INSERT INTO A(id,a) VALUES (1,10);
INSERT INTO A(id,a) VALUES (2,16);
--correct SQL
INSERT INTO A(id,a) VALUES (1,10),(2,16);