大部分内容由mysql官方文档复制粘帖而来。
优化where子句
包括:1. 去除不必要的括号、常量叠加、去除常量条件和索引使用的常量表达式只用一次;
2. 对于MyISAM和HEAP表,在一个单个表上的没有一个WHERE的COUNT(*)直接从表中检索信息。当仅使用一个表时,对NOT NULL表达式也这样做。(这条我没看懂)
3. 无效常数表达式的早期检测。MySQL快速检测某些SELECT语句是不可能的并且不返回行。
4. 如果不使用GROUP BY或分组函数(COUNT()、MIN()……),HAVING与WHERE合并。(怎么个合并法?)
5. 对于联接内的每个表,构造一个更简单的WHERE以便更快地对表进行WHERE计算并且也尽快跳过记录。
6. 所有常数的表在查询中比其它表先读出。常数表为:
空表或只有1行的表。
与在一个PRIMARY KEY或UNIQUE索引的WHERE子句一起使用的表,这里所有的索引部分使用常数表达式并且索引部分被定义为NOT NULL。
下列的所有表用作常数表:
mysql> SELECT * FROM t WHERE primary_key=1;
mysql> SELECT * FROM t1,t2
WHERE t1.primary_key=1 AND t2.primary_key=t1.id;
7. 尝试所有可能性便可以找到表联接的最好联接组合。如果所有在ORDER BY和GROUP BY的列来自同一个表,那么当联接时,该表首先被选中。
8. 如果有一个ORDER BY子句和不同的GROUP BY子句,或如果ORDER BY或GROUP BY包含联接队列中的第一个表之外的其它表的列,则创建一个临时表。
9. 如果使用SQL_SMALL_RESULT,MySQL使用内存中的一个临时表。
10. 每个表的索引被查询,并且使用最好的索引,除非优化器认为使用表扫描更有效。是否使用扫描取决于是否最好的索引跨越超过30%的表。优化器更加复杂,其估计 基于其它因素,例如表大小、行数和I/O块大小,因此固定比例不再决定选择使用索引还是扫描。
11. 在一些情况下,MySQL能从索引中读出行,甚至不查询数据文件。如果索引使用的所有列是数值类,那么只使用索引树来进行查询。
12. 输出每个记录前,跳过不匹配HAVING子句的行。
范围优化
将使用了索引的范围子句进行优化
1. 单元素索引范围条件提取。
首先,定义单元素索引范围条件:
a. 对于BTREE和HASH索引,当使用=、<=>、IN、IS NULL或者IS NOT NULL操作符时,关键元素与常量值的比较关系对应一个范围条件。
b. 对于BTREE索引,当使用>、<、>=、<=、BETWEEN、!=或者<>,或者LIKE 'pattern'(其中 'pattern'不以通配符开始)操作符时,关键元素与常量值的比较关系对应一个范围条件。
c. 对于所有类型的索引,多个范围条件结合OR或AND则产生一个范围条件。
前面描述的“常量值”系指:
a. 查询字符串中的常量
b. 同一联接中的const或system表中的列
c. 无关联子查询的结果
d. 完全从前面类型的子表达式组成的表达式
提取范围条件时,会将所有非索引和索引中like 'parttern'以通配符开始的条件都置为true,然后再合并整个范围条件,例如下面这个例子:
SELECT * FROM t1 WHERE
(key1 < 'abc' AND (key1 LIKE 'abcde%' OR key1 LIKE '%b')) OR
(key1 < 'bar' AND nonkey = 4) OR
(key1 < 'uux' AND key1 > 'z');
最终的提取结果为:(key1 < 'bar')
2. 多元素索引范围条件提取
与单元素有点类似,但是多元素索引范围条件提取出的结果必须是多元素索引前缀元素联合的范围,具体还是看官方文档吧。
索引合并优化
在以下几种情况会使用索引合并:
1. where后面是and的组合:单元素索引或者多元素索引包含所有部分,且条件为确切值(不是范围值)时;或者主键的范围条件值时。此时会采用mysql的索引合并交集算法。
2. where后面是or的组合:单元素索引或者多元素索引包含所有部分,且条件为确切值(不是范围值)时;或者主键的范围条件值时;满足索引合并交集条件时。此时会采用mysql的索引合并并集算法。
3. where后面是or的组合:or组合是一些范围值且不满组索引合并并集算法条件时。此时采用索引合并并集排序算法。排序联合算法和联合算法的区别是排序联合算法必须先索取所有记录的行ID,然后在返回记录前对它们进行排序。
优化is null
优化is null会在下面几种情况出现:
1. 与常量条件结合的is null:
SELECT * FROM tbl_name WHERE key_col=const1 OR key_col=const2 OR key_col IS NULL;
2. 如果WHERE子句包括声明为NOT NULL的列的col_name IS NULL条件,表达式则优化。当列会产生NULL时,不会进行优化;例如,如果来自LEFT JOIN右侧的表。(这条没看懂,暂不举例了)。
3. 与表达式结合的is null:
SELECT * FROM t1, t2 WHERE t1.a=t2.a OR t2.a IS NULL;
SELECT * FROM t1, t2 WHERE t1.a=t2.a AND t2.a IS NULL;
is null优化只能优化一个is null,如下例中只能优化t2.a IS NULL。
SELECT * FROM t1, t2 WHERE (t1.a=t2.a AND t2.a IS NULL) OR (t1.b=t2.b AND t2.b IS NULL);
当优化器优化了is null时,从explain中可以看到TYPE是ref_or_null。(这里的表述不一定正确,我只测试到一种情况下会出现ref_or_null,可参看我之前的一篇博客中关于ref_or_null的说明:http://blog.csdn.net/nkorange/article/details/9214483)
优化distinct
如果不使用查询中命名的所有表的列,MySQL发现第1个匹配后立即停止扫描未使用的表。在下面的情况中,假定t1在t2之前使用(可以用EXPLAIN检查),发现t2中的第1行 后,MySQL不再(为t1中的任何行)读t2:
SELECT DISTINCT t1.a FROM t1, t2 where t1.a=t2.a;
这很好理解。
优化left join和right join