MySQL执行计划是MySQL提供的一种查看SQL与数据库交互行为的工具。可以很直观的帮助开发者发现问题并进行SQL优化。最常用的是EXPLAIN
命令。
使用EXPLAIN
关键字可以模拟优化器的行为,返回MySQL如何使用索引进行搜索和表的连接顺序(JOIN;),并且可以让我们知道在MySQL解析我们的查询时,每个动作后的信息。
查询执行计划信息包含:
当我们使用EXPLAIN
开头,对查询做分析预测后,解析的结果能告诉我们:
要理解和解释执行计划,就需要了解它包含的一些关键信息,并可以对其进行适当的优化。例如,在合适的地方建立索引,改变JOIN顺序,重写查询等,都可以改善查询的效率。
执行计划是MySQL数据库在执行SQL查询时的一个操作步骤集合。它描述了数据库如何执行SQL语句,以及如何从数据表中检索或更新数据。执行计划包括了多种信息,如数据读取的顺序,数据过滤的方式,连接表的方式等。
在MySQL中,可以通过在查询语句前面添加"EXPLAIN"关键字来查看该查询的执行计划。例如:
EXPLAIN SELECT * FROM table_name WHERE column_name = 'value';
这将会返回一个表,其中包含了执行计划的详细信息。
这是查询的标识符,代表查询的组执行顺序。相同的id说明在同一执行阶段。
这个列标明查询的类型。常见的查询类型有SIMPLE(简单查询,不包含子查询或者UNION操作), PRIMARY(主查询,外层查询), SUBQUERY(子查询,在SELECT或者WHERE列表中)等。
输出结果集的表。对于多表查询,会显示访问每个表的顺序。
这是表示MySQL如何对表的行进行遍历的类型。各种类型从最好到最坏分别是:system > const > eq_ref > ref > fulltext > ref_or_null > index_merge > unique_subquery > index_subquery > range > index > ALL。
显示可能用于查询的索引。它并不代表这个索引一定会被使用。
实际使用的索引。如果为NULL,则没有使用索引。
表示索引字段的长度,如果为NULL,则表示不使用索引。
显示使用哪个列或常量与key列进行比较。
估计MySQL需要读取的行数来执行查询。
提供了关于MySQL如何解析查询及查询是否使用索引等信息。
常见的值有Using where, Using temporary, Using filesort等。这些都是MySQL优化器在生成查询执行计划时的一些策略说明:
Using where:表示MySQL服务器将在存储引擎检索行后再进行过滤,这说明查询中有一个WHERE子句,并且存储引擎不会自动过滤这些行。
Using temporary:表示MySQL需要使用一个临时表来存储结果集,这通常发生在对不同列的多次排序时。
Using filesort:表示MySQL需要进行额外的步骤来找出如何检索行,因为它不能仅通过索引来完成。这通常出现在ORDER BY或GROUP BY查询中,当无法使用索引顺序来完成排序时,会进行额外的排序步骤。
这些策略都可能对查询性能产生影响。例如,"Using temporary"和"Using filesort"都可能会导致查询速度变
慢,尤其是在处理大量数据时。
Using index:表示使用了覆盖索引(Covering Index),即所有需要的数据都被直接从索引中读取,而无需从数据表中读取。使用覆盖索引可以大大提高查询性能。
Using join buffer:表示使用了连接缓冲,这是MySQL优化连接操作的一种方式,可以提高连接多张表的效率。
Using sort union:表示使用排序合并算法进行OR操作,该算法可以在不同的索引之间进行排序和合并操作。
Using index condition:表示使用了索引条件推送(Index Condition Pushdown),即将部分WHERE子句条件在存储引擎层进行计算,避免了不必要的行扫描和传输。
MySQL查询优化器常见的一些策略。这些策略并非越多越好,而是根据具体查询和数据表结构来选择最适合的策略。优化器的目标是尽可能减少查询处理所需的磁盘I/O和CPU时间。
MySQL的执行计划基于查询优化器,它的主要任务是找到执行SQL查询的最优方式。优化器会考虑各种可能的执行计划,比如使用哪个索引,以何种顺序连接表,等等,然后根据估算的成本选择一个最优的执行计划。
当你执行一个SQL查询时,MySQL首先会解析这个查询,检查语法是否正确,然后生成一个对应的内部数据结构,我们称之为解析树。接着,优化器会使用各种规则和启发式方法,对解析树进行优化,生成一个或多个可能的执行计划。每个执行计划都对应一个可能的查询执行路径,包括使用哪个索引,以何种顺序连接表,等等。
然后,优化器会对每个执行计划进行成本估算,这个成本主要基于读取数据的数量,也就是IO操作的数量。此外,优化器还会考虑CPU消耗,内存消耗等因素。
最后,优化器会选择成本最低的执行计划来执行这个查询。执行计划中的每个步骤都会被转换为一系列的底层操作,比如读取磁盘上的数据,执行计算,等等,这些操作最终由MySQL的存储引擎来执行。
当你使用EXPLAIN命令查看执行计划时,你看到的就是优化器生成的这个最优执行计划的详细信息。
以下是一个复杂的SQL查询示例
SELECT p.product_name, c.category_name, s.supplier_name, SUM(od.quantity) as total_quantity
FROM products p
INNER JOIN categories c ON p.category_id = c.category_id
INNER JOIN suppliers s ON p.supplier_id = s.supplier_id
INNER JOIN order_details od ON p.product_id = od.product_id
GROUP BY p.product_name, c.category_name, s.supplier_name
HAVING total_quantity > 100
ORDER BY total_quantity DESC;
这个查询涉及到多个表的连接,并使用了聚合函数和分组操作。查询的目标是获取每个产品的名称、所属类别、供应商名称以及总销量,并按照销量进行降序排序。
它包含了多个表的连接操作和聚合函数的使用。通过INNER JOIN语句将四个表(products, categories, suppliers, order_details)连接起来,使用ON子句指定连接的条件。然后通过GROUP BY子句对产品名称、类别名称和供应商名称进行分组,使用SUM函数计算每个组别的总销量。最后,在HAVING子句中对总销量进行筛选,只返回销量大于100的数据。最后,使用ORDER BY子句对总销量进行降序排序。
这个复杂的查询可以用于分析产品销售情况,找出销量最高的产品,并了解它们所属的类别和供应商。
EXPLAIN
的输出可能如下
id | select_type | table | type | possible_keys | key | key_len | ref | rows | Extra |
---|---|---|---|---|---|---|---|---|---|
1 | SIMPLE | p | ALL | NULL | NULL | NULL | NULL | 1000 | Using temporary; Using filesort |
1 | SIMPLE | c | ref | PRIMARY | PRIMARY | 4 | db.p.category_id | 1 | NULL |
1 | SIMPLE | s | eq_ref | PRIMARY | PRIMARY | 4 | db.p.supplier_id | 1 | NULL |
1 | SIMPLE | od | ref | p2 | prod_id | 4 | db.p.product_id | 10 | Using Where |
products,categories,suppliers,order_details
都参与了查询(操作1代表简单查询没有UNION或子查询)。p(products)
要对行进行全表扫描(类型为ALL),结果集预计的行数为1000,并且需要额外的操作(temporary和filesort)用来处理GROUP BY
和ORDER BY
。c (categories)
和 s (suppliers)
均是使用了ref查找方式对应索引PRIMARY
,意味着它们确认supplier_id
和 category_id
是作为索引存在的,并且每一个可供该基表使用的联接列都参与了索引查找,在联接时每找出一行。od (order_details)
使用了索引prod_id
,该操作与提供的prod_id匹配行,并在对结果进行执行,并过滤掉结果中未满足WHERE子句条件的记录。这个计划告诉我们,这个查询可能的优化:可能要考虑为产量表
products
添加以product_id作为主键的索引,用于减少全表扫描的影响。
1. MySQL执行计划
- 用途:查看SQL与数据库交互行为的工具
- 命令:EXPLAIN
2. 查询执行计划信息
- 表的读取顺序
- 数据读取操作的操作类型
- 可用的索引与实际使用的索引
- 表之间的引用
- 优化器查询的行数
3 执行计划的关键元素
- id:查询的执行顺序
- select_type:查询的类型
- table:输出结果集的表
- type:MySQL在表中找到所需行的方式
- possible_keys:可能应用的索引
- key:实际应用的索引
- key_len:索引字段的长度
- ref:关键字的比较
- rows:查找所需读取的行数
- Extra:MySQL解决查询的详细信息
4. 底层原理
- 基于查询优化器
- 优化器任务:找到执行SQL查询的最优方式
- 执行计划:优化器生成的最优执行计划的详细信息