mysql 查询优化之WHERE子句优化

本小节主要讨论针对WHERE子句的优化。实例中使用的是SELECT语句,但是这些优化规则同样适用于在DELETEUPDATE语句中使用的WHERE子句。

注意
由于MySQL优化器在持续改进中,因此MySQL所表现出来的优化效果可能与文档中描述的不一致。

您可能尝试去重写查询以便能更快地进行算术运算,即使牺牲了可读性。由于MySQL会自动执行类似的优化,所以通常可以避免这种工作,并使查询保持更易理解和可维护的形式。MySQL执行的一些优化如下:

  • 去除不必要的括号:
   ((a AND b) AND c OR (((a AND b) AND (c AND d))))
-> (a AND b AND c) OR (a AND b AND c AND d)
  • 常量折叠:
(a b>5 AND b=c AND a=5
  • 去除恒定条件:
(b>=5 AND b=5) OR (b=6 AND 5=5) OR (b=7 AND 5=6)
-> b=5 OR b=6

在MySQL 8.0.14及更高版本中,这是在准备期间而不是在优化阶段期间进行的,这有助于简化连接。有关更多信息和示例,请参见 第8.2.1.8节“外部连接优化”。

  • 索引使用的常量表达式仅计算一次。

  • 从MySQL 8.0.16开始,对具有常量值的数值类型列进行比较,检查并折叠或删除无效或不合法值:

# CREATE TABLE t (c TINYINT UNSIGNED NOT NULL);
  SELECT * FROM t WHERE c ≪ 256;
-≫ SELECT * FROM t WHERE 1;
  • 对于MyISAM 和 MEMORY 表,在单表上使用COUNT(*)且没有使用WHERE子句的话则直接从表信息中提取。这个规则同样适用于在单表上使用NOT NULL表达式。

  • 提前检测无效常量表达式。MySQL快速检测到某些不可能执行的SELECT语句,并且不返回任何行。

  • 如果不使用GROUP BY或聚合函数(COUNT(), MIN()……等),HAVING将与WHERE合并。

  • 对于联接内的每个表,构造一个更简单的WHERE语句以便能更快地对表进行WHERE计算,并且可以尽快地跳过记录。

  • 所有的常量表会比查询中的其他表先读取。常量表为:

    • 空表或只有一行记录。
    • 与在一个PRIMARY KEY或UNIQUE索引的WHERE子句一起使用的表,这里所有的索引部分都是和常数表达式比较并且索引部分被定义为NOT NULL。
      以下表被视为常量表:
        SELECT * FROM t WHERE primary_key=1;
        SELECT * FROM t1,t2
        WHERE t1.primary_key=1 AND t2.primary_key=t1.id;
      
  • 尝试所有的可能性,以便找到最佳的表联接的组合方式。如果所有在ORDER BY 和 GROUP BY 语句中的字段都是来自同一个表,在联接时,这个表应该作为主表。

  • 如果有一个ORDER BY子句和不同的GROUP BY子句,或者是ORDER BY或GROUP BY包含联接队列中的第一个表之外的其它表的列,则会创建一个临时表。

  • 如果使用SQL_SMALL_RESULT,MySQL会使用内存中的一个临时表。

  • 查询每个表索引,并使用最佳索引,除非优化器认为使用表扫描更有效。是否使用扫描取决于最好的索引跨越是否超过30%的表。优化器现在变得更加复杂,它的评估会基于更多的因素,例如表大小、行数和I/O块大小,因此固定比例不再决定选择使用索引还是扫描。

  • 在一些情况下,MySQL能从索引中读出行,甚至不查询数据文件。如果索引使用的所有列是数值类,那么只需要使用索引树即可完成查询。

  • 输出每条记录前,跳过不匹配HAVING子句的记录。

下面是一些快速查询的例子:

SELECT COUNT(*) FROM tbl_name;

SELECT MIN(key_part1),MAX(key_part1) FROM tbl_name;

SELECT MAX(key_part2) FROM tbl_name
  WHERE key_part1=constant;

SELECT ... FROM tbl_name
  ORDER BY key_part1,key_part2,... LIMIT 10;

SELECT ... FROM tbl_name
  ORDER BY key_part1 DESC, key_part2 DESC, ... LIMIT 10;

下列查询仅使用索引树就可以解决(假设索引的列为数值型):

SELECT key_part1,key_part2 FROM tbl_name WHERE key_part1=val;

SELECT COUNT(*) FROM tbl_name
  WHERE key_part1=val1 AND key_part2=val2;

SELECT key_part2 FROM tbl_name GROUP BY key_part1;

下列查询使用索引按排序顺序检索行,不用另外的排序:

SELECT ... FROM tbl_name
  ORDER BY key_part1,key_part2,... ;

SELECT ... FROM tbl_name
  ORDER BY key_part1 DESC, key_part2 DESC, ... ;

原文地址

你可能感兴趣的:(mysql 查询优化之WHERE子句优化)