EXPLAIN语法(获取SELECT相关信息)
EXPLAIN tbl_name
或:
EXPLAIN [EXTENDED] SELECT select_options
EXPLAIN 语句可以用作DESCRIBE 的一个同义词,或获得关于MySQL 如何执行SELECT 语句的信息:
· EXPLAIN tbl_name 是DESCRIBE tbl_name 或SHOW COLUMNS FROM tbl_name 的一个同义词。
· 如果在SELECT 语句前放上关键词EXPLAIN ,MySQL 将解释它如何处理SELECT ,提供有关表如何联接和联接的次序。
该节解释EXPLAIN 的第2 个用法。
借助于EXPLAIN ,可以知道什么时候必须为表加入索引以得到一个使用索引来寻找记录的更快的SELECT 。
如果由于使用不正确的索引出现了问题,应运行ANALYZE TABLE 更新表的统计(例如关键字集的势),这样会影响优化器进行的选择。参见13.5.2.1节,“ANALYZE TABLE语法” 。
还可以知道优化器是否以一个最佳次序联接表。为了强制优化器让一个SELECT 语句按照表命名顺序的联接次序,语句应以STRAIGHT_JOIN 而不只是SELECT 开头。
EXPLAIN 为用于SELECT 语句中的每个表返回一行信息。表以它们在处理查询过程中将被MySQL 读入的顺序被列出。MySQL 用一遍扫描多次联接(single-sweep multi-join )的方式解决所有联接。这意味着MySQL 从第一个表中读一行,然后找到在第二个表中的一个匹配行,然后在第3 个表中等等。当所有的表处理完后,它输出选中的列并且返回表清单直到找到一个有更多的匹配行的表。从该表读入下一行并继续处理下一个表。
当使用EXTENDED 关键字时,EXPLAIN 产生附加信息,可以用SHOW WARNINGS 浏览。该信息显示优化器限定SELECT 语句中的表和列名,重写并且执行优化规则后SELECT 语句是什么样子,并且还可能包括优化过程的其它注解。
EXPLAIN 的每个输出行提供一个表的相关信息,并且每个行包括下面的列:
· id
SELECT 识别符。这是SELECT 的查询序列号。
· select_type
SELECT 类型,可以为以下任何一种:
o SIMPLE
简单SELECT ( 不使用UNION 或子查询)
o PRIMARY
最外面的SELECT
o UNION
UNION 中的第二个或后面的SELECT 语句
o DEPENDENT UNION
UNION 中的第二个或后面的SELECT 语句,取决于外面的查询
o UNION RESULT
UNION 的结果。
o SUBQUERY
子查询中的第一个SELECT
o DEPENDENT SUBQUERY
子查询中的第一个SELECT ,取决于外面的查询
o DERIVED
导出表的SELECT ( FROM 子句的子查询)
· table
输出的行所引用的表。
· type
联接类型。下面给出各种联接类型,按照从最佳类型到最坏类型进行排序:
o system
表仅有一行(= 系统表) 。这是const 联接类型的一个特例。
o const
表最多有一个匹配行,它将在查询开始时被读取。因为仅有一行,在这行的列值可被优化器剩余部分认为是常数。const 表很快,因为它们只读取一次!
const 用于用常数值比较PRIMARY KEY 或UNIQUE 索引的所有部分时。在下面的查询中,tbl_name 可以用于const 表:
SELECT * from tbl_name
WHERE
primary_key
=1 ;
SELECT * from tbl_name
WHERE primary_key_part1
=1 和 primary_key_part2
=2 ; o eq_ref
对于每个来自于前面的表的行组合,从该表中读取一行。这可能是最好的联接类型,除了const 类型。它用在一个索引的所有部分被联接使用并且索引是UNIQUE 或PRIMARY KEY 。
eq_ref 可以用于使用= 操作符比较的带索引的列。比较值可以为常量或一个使用在该表前面所读取的表的列的表达式。
在下面的例子中,MySQL 可以使用eq_ref 联接来处理ref_tables :
SELECT * FROM ref_table
, other_table
WHERE
ref_table
. key_column
= other_table
. column
SELECT * FROM ref_table
, other_table
WHERE
ref_table
. key_column_part1
= other_table
. column
AND
ref_table
. key_column_part2
=1; o ref
对于每个来自于前面的表的行组合,所有有匹配索引值的行将从这张表中读取。如果联接只使用键的最左边的前缀,或如果键不是UNIQUE 或PRIMARY KEY (换句话说,如果联接不能基于关键字选择单个行的话),则使用ref 。如果使用的键仅仅匹配少量行,该联接类型是不错的。
ref 可以用于使用= 或<=> 操作符的带索引的列。
在下面的例子中,MySQL 可以使用ref 联接来处理ref_tables :
SELECT * FROM ref_table
WHERE
key_column
= expr
SELECT * FROM ref_table
, other_table
WHERE
ref_table
. key_column
= other_table
. column
SELECT * FROM ref_table
, other_table
WHERE
ref_table
. key_column_part1
= other_table
. column
AND
ref_table
. key_column_part2
=1; o ref_or_null
该联接类型如同ref ,但是添加了MySQL 可以专门搜索包含NULL 值的行。在解决子查询中经常使用该联接类型的优化。
在下面的例子中,MySQL 可以使用ref_or_null 联接来处理ref_tables :
SELECT * FROM ref_table
WHERE key_column
= expr
OR
key_column
IS NULL;
参见7.2.7节,“MySQL如何优化IS NULL” 。
o index_merge
该联接类型表示使用了索引合并优化方法。在这种情况下,key 列包含了使用的索引的清单,key_len 包含了使用的索引的最长的关键元素。详细信息参见7.2.6节,“索引合并优化” 。
o unique_subquery
该类型替换了下面形式的IN 子查询的ref :
value
IN (SELECT
primary_key
FROM
single_table
WHERE
some_expr
) unique_subquery 是一个索引查找函数,可以完全替换子查询,效率更高。
o index_subquery
该联接类型类似于unique_subquery 。可以替换IN 子查询,但只适合下列形式的子查询中的非唯一索引:
value
IN (SELECT
key_column
FROM
single_table
WHERE
some_expr
) o range
只检索给定范围的行,使用一个索引来选择行。key 列显示使用了哪个索引。key_len 包含所使用索引的最长关键元素。在该类型中ref 列为NULL 。
当使用= 、<> 、> 、>= 、< 、<= 、IS NULL 、<=> 、BETWEEN 或者IN 操作符,用常量比较关键字列时,可以使用range :
SELECT * FROM tbl_name
WHERE key_column
= 10;
SELECT * FROM tbl_name
WHERE key_column
BETWEEN 10 and 20;
SELECT * FROM tbl_name
WHERE key_column
IN (10,20,30);
SELECT * FROM tbl_name
WHERE key_part1
= 10 AND key_part2 IN (10,20,30);
o index
该联接类型与ALL 相同,除了只有索引树被扫描。这通常比ALL 快,因为索引文件通常比数据文件小。
当查询只使用作为单索引一部分的列时,MySQL 可以使用该联接类型。
o ALL
对于每个来自于先前的表的行组合,进行完整的表扫描。如果表是第一个没标记const 的表,这通常不好,并且通常在它情况下很 差。通常可以增加更多的索引而不要使用ALL ,使得行能基于前面的表中的常数值或列值被检索出。
· possible_keys
possible_keys 列指出MySQL 能使用哪个索引在该表中找到行。注意,该列完全独立于EXPLAIN 输出所示的表的次序。这意味着在possible_keys 中的某些键实际上不能按生成的表次序使用。
如果该列是NULL ,则没有相关的索引。在这种情况下,可以通过检查WHERE 子句看是否它引用某些列或适合索引的列来提高你的查询性能。如果是这样,创造一个适当的索引并且再次用EXPLAIN 检查查询。参见13.1.2节,“ALTER TABLE语法” 。
为了看清一张表有什么索引,使用SHOW INDEX FROM tbl_name 。
· key
key 列显示MySQL 实际决定使用的键(索引)。如果没有选择索引,键是NULL 。要想强制MySQL 使用或忽视possible_keys 列中的索引,在查询中使用FORCE INDEX 、USE INDEX 或者IGNORE INDEX 。参见13.2.7节,“SELECT语法” 。
对于MyISAM 和BDB 表,运行ANALYZE TABLE 可以帮助优化器选择更好的索引。对于MyISAM 表,可以使用myisamchk --analyze 。参见13.5.2.1节,“ANALYZE TABLE语法” 和5.9.4节,“表维护和崩溃恢复” 。
· key_len
key_len 列显示MySQL 决定使用的键长度。如果键是NULL ,则长度为NULL 。注意通过key_len 值我们可以确定MySQL 将实际使用一个多部关键字的几个部分。
· ref
ref 列显示使用哪个列或常数与key 一起从表中选择行。
· rows
rows 列显示MySQL 认为它执行查询时必须检查的行数。
· Extra
该列包含MySQL 解决查询的详细信息。下面解释了该列可以显示的不同的文本字符串:
o Distinct
MySQL 发现第1 个匹配行后,停止为当前的行组合搜索更多的行。
o Not exists
MySQL 能够对查询进行LEFT JOIN 优化,发现1 个匹配LEFT JOIN 标准的行后,不再为前面的的行组合在该表内检查更多的行。
下面是一个可以这样优化的查询类型的例子:
SELECT * 从t1 LEFT JOIN t2 ON t1.id=t2.id
WHERE t2.id IS NULL
; 假定t2.id 定义为NOT NULL 。在这种情况下,MySQL 使用t1.id 的值扫描t1 并查找t2 中的行。如果MySQL 在t2 中发现一个匹配的行,它知道t2.id 绝不会为NULL ,并且不再扫描t2 内有相同的id 值的行。换句话说,对于t1 的每个行,MySQL 只需要在t2 中查找一次,无论t2 内实际有多少匹配的行。
o range checked for each record (index map: #)
MySQL 没有发现好的可以使用的索引,但发现如果来自前面的表的列值已知,可能部分索引可以使用。对前面的表的每个行组合,MySQL 检查是否可以使用range 或index_merge 访问方法来索取行。关于适用性标准的描述参见7.2.5节,“范围优化” 和7.2.6节,“索引合并优化” ,不同的是前面表的所有列值已知并且认为是常量。
这并不很快,但比执行没有索引的联接要快得多。
o Using filesort
MySQL 需要额外的一次传递,以找出如何按排序顺序检索行。通过根据联接类型浏览所有行并为所有匹配WHERE 子句的行保存排序关键字和行的指针来完成排序。然后关键字被排序,并按排序顺序检索行。参见7.2.12节,“MySQL如何优化ORDER BY” 。
o Using index
从只使用索引树中的信息而不需要进一步搜索读取实际的行来检索表中的列信息。当查询只使用作为单一索引一部分的列时,可以使用该策略。
o Using temporary
为了解决查询,MySQL 需要创建一个临时表来容纳结果。典型情况如查询包含可以按不同情况列出列的GROUP BY 和ORDER BY 子句时。
o Using where
WHERE 子句用于限制哪一个行匹配下一个表或发送到客户。除非你专门从表中索取或检查所有行,如果Extra 值不为Using where 并且表联接类型为ALL 或index ,查询可能会有一些错误。
如果想要使查询尽可能快,应找出Using filesort 和Using temporary 的Extra 值。
o Using sort_union(...) , Using union(...) , Using intersect(...)
这些函数说明如何为index_merge 联接类型合并索引扫描。详细信息参见7.2.6节,“索引合并优化” 。
o Using index for group-by
类似于访问表的Using index 方式,Using index for group-by 表示MySQL 发现了一个索引,可以用来查询GROUP BY 或DISTINCT 查询的所有列,而不要额外搜索硬盘访问实际的表。并且,按最有效的方式使用索引,以便对于每个组,只读取少量索引条目。详情参见7.2.13节,“MySQL如何优化GROUP BY” 。
通过相乘EXPLAIN 输出的rows 列的所有值,你能得到一个关于一个联接如何的提示。这应该粗略地告诉你MySQL 必须检查多少行以执行查询。当你使用max_join_size 变量限制查询时,也用这个乘积来确定执行哪个多表SELECT 语句。参见7.5.2节,“调节服务器参数” 。
下列例子显示出一个多表JOIN 如何能使用EXPLAIN 提供的信息逐步被优化。
假定你有下面所示的SELECT 语句,计划使用EXPLAIN 来检查它:
EXPLAIN SELECT tt.TicketNumber, tt.TimeIn,
tt.ProjectReference, tt.EstimatedShipDate, tt.ActualShipDate, tt.ClientID, tt.ServiceCodes, tt.RepetitiveID, tt.CurrentProcess, tt.CurrentDPPerson, tt.RecordVolume, tt.DPPrinted, et.COUNTRY, et_1.COUNTRY, do.CUSTNAME FROM tt, et, et AS et_1, do WHERE tt.SubmitTime IS NULL AND tt.ActualPC = et.EMPLOYID AND tt.AssignedPC = et_1.EMPLOYID AND tt.ClientID = do.CUSTNMBR;
对于这个例子,假定:
· 被比较的列声明如下:
表
列
列类型
tt
ActualPC
CHAR(10)
tt
AssignedPC
CHAR(10)
tt
ClientID
CHAR(10)
et
EMPLOYID
CHAR(15)
do
CUSTNMBR
CHAR(15)
· 表有下面的索引:
表
索引
tt
ActualPC
tt
AssignedPC
tt
ClientID
et
EMPLOYID ( 主键)
do
CUSTNMBR ( 主键)
· tt.ActualPC 值不是均匀分布的。
开始,在进行优化前,EXPLAIN 语句产生下列信息:
table type possible_keys key key_len ref rows Extra et ALL PRIMARY NULL NULL NULL 74 do ALL PRIMARY NULL NULL NULL 2135 et_1 ALL PRIMARY NULL NULL NULL 74 tt ALL AssignedPC, NULL NULL NULL 3872
ClientID, ActualPC range checked for each record (key map: 35)
因为type 对每张表是ALL ,这个输出显示MySQL 正在对所有表产生一个笛卡尔乘积;即每一个行的组合!这将花相当长的时间,因为必须检查每张表的行数的乘积!对于一个实例,这是74 * 2135 * 74 * 3872 = 45,268,558,720 行。如果表更大,你只能想象它将花多长时间……
这里的一个问题是MySQL 能更高效地在声明具有相同类型和尺寸的列上使用索引。在本文中,VARCHAR 和CHAR 是相同的,除非它们声明为不同的长度。因为tt.ActualPC 被声明为CHAR(10) 并且et.EMPLOYID 被声明为CHAR(15) ,长度不匹配。
为了修正在列长度上的不同,使用ALTER TABLE 将ActualPC 的长度从10 个字符变为15 个字符:
mysql> ALTER TABLE tt MODIFY ActualPC VARCHAR(15);
现在tt.ActualPC 和et.EMPLOYID 都是VARCHAR(15) ,再执行EXPLAIN 语句产生这个结果:
table type possible_keys key key_len ref rows Extra tt ALL AssignedPC, NULL NULL NULL 3872 Using
ClientID, where ActualPC
do ALL PRIMARY NULL NULL NULL 2135
range checked for each record (key map: 1)
et_1 ALL PRIMARY NULL NULL NULL 74
range checked for each record (key map: 1)
et eq_ref PRIMARY PRIMARY 15 tt.ActualPC 1
这不是完美的,但是好一些了:rows 值的乘积少了一个因子74 。这个版本在几秒内执行完。
第2 种方法能消除tt.AssignedPC = et_1.EMPLOYID 和tt.ClientID = do.CUSTNMBR 比较的列的长度失配问题:
mysql> ALTER TABLE tt MODIFY AssignedPC VARCHAR(15),
->
MODIFY ClientID VARCHAR(15);
EXPLAIN 产生的输出显示在下面:
table type possible_keys key key_len ref rows Extra et ALL PRIMARY NULL NULL NULL 74 tt ref AssignedPC, ActualPC 15 et.EMPLOYID 52 Using
ClientID, where ActualPC
et_1 eq_ref PRIMARY PRIMARY 15 tt.AssignedPC 1 do eq_ref PRIMARY PRIMARY 15 tt.ClientID 1
这几乎很好了。
剩下的问题是,默认情况,MySQL 假设在tt.ActualPC 列的值是均匀分布的,并且对tt 表不是这样。幸好,很容易告诉MySQL 来分析关键字分布:
mysql> ANALYZE TABLE tt ;
现在联接是“完美”的了,而且EXPLAIN 产生这个结果:
table type possible_keys key key_len ref rows Extra tt ALL AssignedPC NULL NULL NULL 3872 Using
ClientID, where ActualPC
et eq_ref PRIMARY PRIMARY 15 tt.ActualPC 1 et_1 eq_ref PRIMARY PRIMARY 15 tt.AssignedPC 1 do eq_ref PRIMARY PRIMARY 15 tt.ClientID 1 注意在从EXPLAIN 输出的rows 列是一个来自MySQL 联接优化器的“教育猜测”。你应该检查数字是否接近事实。如果不是,可以通过在SELECT 语句里面使用STRAIGHT_JOIN 并且试着在FROM 子句以不同的次序列出表,可能得到更好的性能。