圣斗士Morty

MySQL 优化 —— EXPLAIN 执行计划详解

引言

本博客大部分内容翻译自MySQL 官网 Understanding the Query Execution Plan 专题。另外有一些补充，则来自于网课以及《高性能MySQL（第三版）》。

根据我们的表、字段、索引、以及 where 子句中的条件等信息，MySQL 优化器会考虑各种技术来更高效地执行查找。一个大表中的查找不一定要读取所有记录；多表连接也不一定需要比较每条联合记录。优化器选择的执行最优查询的操作集，称为“查询执行计划”，也可以说是 EXPLAIN 计划。我们的目标就是找到那些可以将查询优化地更好的点，然后通过学习 SQL 语法和索引等技术，来改善执行计划。

一、EXPLAIN 介绍

EXPLAIN 语句提供了 MySQL 如何执行语句的信息：

1、MySQL5.6 之后 EXPLAIN 可以和 SELECT DELETE INSERT REPLACE UPDATE 语句等一起工作；

2、当 EXPLAIN 和一个可解释的语句一起使用时，MySQL 就会展示来自优化器的关于语句执行计划的信息。即，MySQL 会解释它将会怎样执行语句，包括表是如何连接的，以什么方式排序的等信息。

3、When EXPLAIN is used with FOR CONNECTION connection_id rather than an explainable statement, it displays the execution plan for the statement executing in the named connection.（这句暂不翻译）

4、对于 SELECT 语句， EXPLAIN 提供了额外的执行计划信息，可以用 SHOW WARNINGS 来查看。参考：Section 8.8.3, “Extended EXPLAIN Output Format”.

5、EXPLAIN对于检查涉及分区表的查询非常有用。参考：Section 22.3.5, “Obtaining Information About Partitions”.

6、FORMAT 选项可以用于选择输出格式。TRADITIONAL 以表格的形式展示。如果没有指定 FORMAT 选项，TRADITIONAL 就是默认的。JSON 格式会以 json 格式展示 EXPLAIN 信息。例如：EXPLAIN FORMAT = JSON SELECT... 。

在 EXPLAIN 的帮助下，你可以清楚的知道为了让查询变得更快，该在哪里给表添加索引。你也可以知道优化器是否以最佳的顺序连接各个表。为了让优化器使用 SELECT 语句中表的命名顺序连接各表，以 SELECT STRAIGHT_JOIN(而不是SELECT)开头即可。（参考：Section 13.2.9, “SELECT Statement”）但是，STRAIGHT_JOIN 可能会妨碍索引的使用，因为它禁用了半连接转换（because it disables semijoin transformations. ）。参考：Section 8.2.2.1, “Optimizing Subqueries, Derived Tables, and View References with Semijoin Transformations”.

优化器跟踪（The optimizer trace）有时可能提供与 EXPLAIN 互补的信息。但是，优化器跟踪的格式和内容会受不同版本的影响。更多细节，参考：MySQL Internals: Tracing the Optimizer.

如果你对本应该使用索引而没有用到索引的情况感到疑惑，执行一下 ANALYZE TABLE 来更新表统计信息。例如列的基数（cardinality of keys），这会影响优化器做出的选择。参考：Section 13.7.2.1, “ANALYZE TABLE Statement”.

注意：

EXPLAIN 还可以用来获取表的列的信息。

EXPLAIN tb1_name 与 DESCRIBE tb1_name 、 SHOW COLUMNS FROM tb1_name 是等价的。

更多信息，参考：Section 13.8.1, “DESCRIBE Statement”，和 Section 13.7.5.5, “SHOW COLUMNS Statement”。

二、EXPLAIN 的输出格式

EXPLAIN会为 select 语句中的每张表返回一行信息。并会以MySQL处理语句时读取这些表的顺序罗列它们。

MySQL 解决所有 join 的方法是使用一个“嵌套循环关联”的方法。也就是说，MySQL会从第一张表中读取一条记录，然后找到第二张表中与之匹配的记录，然后再找第三张表，依此类推。当所有的表处理完毕，MySQL会输出查询的列并回溯表列表（table list），直到找到一个有更多行的表（译者注：连接表的时候，主表查询出的记录往往是最多的，从主表开始关联查询，再回溯到主表，可能官网想表达的是这个意思）。下一条记录会从该表中读取，并且继续处理下一张表。

EXPLAIN 输出包含了分区信息（partitions 列）。同样，对于 SELECT 语句，EXPLAIN 会生成扩展信息，只要在 EXPLAIN 执行完成后，直接执行 SHOW WARNINGS 即可。参考：Section 8.8.3, “Extended EXPLAIN Output Format”

注意

旧的MySQL版本中, 分区和扩展信息使用 EXPLAIN PARTITIONS 和 EXPLAIN EXTENDED 输出。这些语法依然向后兼容，但是分区和扩展输出现在默认都是开启的了。所以 PARTITIONS 和 EXTENDED 关键字完全多余。未来版本也会移除的。

不可以在EXPLAIN语句中同时使用 PARTITIONS 和 EXTENDED 关键字。另外，哪一个都不能和 FORMAT 选项一起使用。

MySQL Workbench （译者注：这是一款由 MySQL 官方出品的，类似 Navicat 的数据库管理工具）有一个 Visual Explain 功能，可以提供可视化的 EXPLAIN 输出信息。参考：Tutorial: Using Explain to Improve Query Performance.

2.1 EXPLAIN 输出字段（EXPLAIN Output Columns）

这一节描述了 EXPLAIN 的输出字段。后面的两节则提供了更多的关于 type 和 Extra 字段的信息。

EXPLAIN输出的每一行都对应一张表。下面的表提供了EXPLAIN的输出字段，第一列是字段名称，第二列是当 FORMAT = JSON 时的输出字段名称：

Column	JSON Name	Meaning
`id`	`select_id`	The `SELECT` identifier：查询id
`select_type`	None	The `SELECT` type：查询类型
`table`	`table_name`	The table for the output row：对应的表
`partitions`	`partitions`	The matching partitions：匹配的分区
`type`	`access_type`	The join type：访问类型
`possible_keys`	`possible_keys`	The possible indexes to choose：可能用到的索引
`key`	`key`	The index actually chosen：真正被用到的索引
`key_len`	`key_length`	The length of the chosen key：用到的索引长度
`ref`	`ref`	The columns compared to the index：与索引比较的列
`rows`	`rows`	Estimate of rows to be examined：大约要检索的行数
`filtered`	`filtered`	Percentage of rows filtered by table condition：按表条件过滤的行的百分比
`Extra`	None	Additional information：附加信息

1、id（JSON 名：select_id）

SELECT 标识符（SELECT identifier）。这是一个连续的数字，用以标识查询中的 SELECT 。如果引用了其他行的联合结果集（union result of other rows），那么 id 会为 NULL。这种情况下，该行的 table 字段会显示为这样的形式，表示该行代表了 id 值为 M 和 N 的行的联合（the row refers to the union of the rows with id values of M and N ）。

重点：id 是一个自然数编号，如1、2，但有时也可以是NULL。如上所述，NULL的时候，就是引用了一个 UNION 结果集。

当 id 为数字的时候，编号大的会先执行。有时候，编号会相同，相同编号就从上到下执行。

2、select_type（JSON 名：无）

查询类型。MySQL将查询分为简单和复杂类型，复杂类型可分为三大类：简单子查询、FROM子查询，以及UNION查询。select_type 就是用于区分这三类复杂查询。可选值如下（红色标记为常见值）：

`select_type` Value	JSON Name	Meaning
`SIMPLE`	None	简单查询（没有任何 UNION 或子查询）。
`PRIMARY`	None	主查询，如果查询中包含任何复杂的子部分，那么最外层查询被标记PRIMARY。
`UNION`	None	UNION 中的第二个或后面的SELECT语句
`DEPENDENT UNION`	`dependent` (`true`)	UNION 中的第二个或后面的SELECT语句, 依赖于外部查询
`UNION RESULT`	`union_result`	从UNION 的结果获取数据的SELECT。
`SUBQUERY`	None	SELECT子句或WHERE子句中的子查询
`DEPENDENT SUBQUERY`	`dependent` (`true`)	子查询中的第一个 SELECT, 依赖于外层查询
`DERIVED`	None	派生表。FROM子句中的子查询。MySQL会递归执行这些子查询，把结果放在临时表里。
`MATERIALIZED`	`materialized_from_subquery`	Materialized subquery 物化子查询。参考《MySQL高级 —— 查询性能优化》4.1节
`UNCACHEABLE SUBQUERY`	`cacheable` (`false`)	非缓存子查询，结果不能被缓存的子查询，必须被外部查询的每一行重新求得
`UNCACHEABLE UNION`	`cacheable` (`false`)	非缓存子查询（uncacheable subquery）的 UNION 中的第二个或后面的 SELECT

SUBQUERY还可以被标记为DEPENDENT SUBQUERY，这一般是指SELECT依赖于外层查询发现的数据（很可能是依赖于FROM派生表的外层SELECT）。参考：Section 13.2.10.7, “Correlated Subqueries” 。

DEPENDENT SUBQUERY 的取值与 UNCACHEABLE SUBQUERY（由于用户变量等原因）的取值不同。对于 DEPENDENT SUBQUERY ，对于来自其外部查询的变量的每组不同值，子查询只重新计算一次。而对于 UNCACHEABLE SUBQUERY ，对外部查询的每行记录，该子查询都会计算一遍。

子查询缓存与缓存中的查询结果缓存不一样（具体描述参考 Section 8.10.3.1, “How the Query Cache Operates”）。子查询缓存发生在查询执行过程中，而查询结果缓存只在查询执行完毕时才会存储结果。

当你在 EXPLAIN 语句中指定了 FORMAT = JSON ，输出的结果并没有一个对应 select_type 的单独属性；query_block 属性对应给定的 SELECT 。与刚才显示的大多数 SELECT 子查询类型等价的属性都是有的，并且在合适的时机就会展示。不过并没有与 SIMPLE 和 PRIMARY 等价的 JSON 值。

select_type 属性值对于非 SELECT 语句，会展示影响表的语句类型，如 DELETE 语句的 select_type 就是 DELETE。

3、table（JSON 名：table_name）

explain 输出的每一行都对应一个表别名或表名。它可以是下面的值中的一个：

: 这一行引用了 id 值为 M 和 N 的表的联合。

: 这一行引用了 id 值为 N 的表所派生的表。派生的表可能是一个结果集，比如，FROM 子句中的子查询。

: 这一行引用了 id 值为 N 的物化子查询的结果。参考：Section 8.2.2.2, “Optimizing Subqueries with Materialization”.

4、partitions（JSON 名：partitions）

查询的记录将会在哪个分区中匹配。NULL 代表没有分区表。参考： Section 22.3.5, “Obtaining Information About Partitions”.

5、type（JSON 名：access_type）

关联类型，但更准确的说法是——访问类型，换言之就是MySQL决定如何查找表中的行。参考 2.2 节。

6、possible_keys（JSON 名：possible_keys）

该属性可以表明查询中，对应表有哪些索引可以使用。注意这个属性完全不依赖于表在 explain 输出中的显示顺序。也就是说，以生成的表顺序，possible_keys 中的有些索引可能实际中并不会用到。

如果该属性是 NULL (或者在 JSON 格式中是 undefined )，代表没有相关的索引。这时，你可能就应该努力通过调试 WHERE 子句来提升你的查询性能，检查是否涉及到了一些字段或者适合索引查询的字段。如果有，就创建一个合适的索引，然后再次通过 EXPLAIN 进行检验。

查看一个表有哪些索引，可以使用 SHOW INDEX FROM tbl_name 语句。

7、key（JSON 名：key）

这一列表示 MySQL 决定采用哪个索引来优化对该表的访问。如果 MySQL 决定使用 possible_keys 中的一个索引去查找记录，那么这个索引就会列在 key 属性中。

key 中也会出现 possible_key 中没有出现的索引。发生这种情况，很可能是 possible_keys 没有找到适合查询的索引，但是所有查询的字段都在索引中。也就是说，查询使用了覆盖索引。因此，尽管它不用于决定要查询哪些行，但却依然可以用于查询字段，因为索引扫描依然比行扫描更高效。换句话说，possible_keys 揭示了哪一个索引能有助于高效地行查找，而 key 显示的是优化采用哪一个索引可以最小化查询成本。

对于InnoDB ，即使查询列表中有主键，二级索引也可能覆盖所查询的字段，因为InnoDB用每个二级索引存储了主键值。如果列是NULL, MySQL就找不到索引来更有效地执行查询。

要强制MySQL使用或忽略在 possiblele_keys 中列出的索引，请在查询中使用 FORCE INDEX，USE INDEX 或 IGNORE INDEX 。参考： Section 8.9.4, “Index Hints”.

对于 MyISAM，运行 ANALYZE TABLE 可以帮助优化器选择更好的索引。对于 MyISAM 表来说， myisamchk --analyze 也是一样的。参考： Section 13.7.2.1, “ANALYZE TABLE Statement”, 和 Section 7.6, “MyISAM Table Maintenance and Crash Recovery”.

8、key_len（JSON 名：key_length）

该字段表示 MySQL 在索引里使用的字节数。

因为key_len是通过查找表的定义而被计算出，而不是表中的数据，因此它显示了在索引字段中可能的最大长度，而不是表中数据使用的实际字节数。key_len 的值可以让你判断 MySQL 究竟用到了复合索引的哪几个索引列。如果 key 属性的值为 NULL , 那么 key_len 肯定也是 NULL 。

由于索引的存储格式，那些可以为 NULL 的字段的索引长度要比非空字段的索引长度大一些。

MySQL并不总是显示一个索引真正使用了多少。例如，如果对一个前缀模式匹配（例如 '张%'）执行LIKE查询，它会显示列的完整宽度正在被使用。

计算 key_len 的简易方法：

int 类型在MySQL中以4个字节存储，key_len 为 4，如果列值允许为 NULL，那么需要 + 1，即 key_len 为 5.

double 类型以8个字节存储，key_len 为 8，如果允许 NULL，那么同样 +1，即 key_len 为 9.

char(n) 定长字符串，首先需要看字符集，常见的utf8以3个字节存储每个字符，gbk用2个，latin用1个。key_len 就等于每个字节长度乘以允许最大字符数n，如果允许NULL，key_len 也要 +1。例如 char(20) DEFAULT NULL，编码为utf8 ,那么 key_len 就是 3 × 20 + 1 = 61。如果不允许为 NULL ，就是60。

varchar(n)变长字符串，每个字符：utf8为3字节、gbk为2字节、latin为1字节。由于是变长，因此 key_len 要 +2，如果允许 NULL，同样 +1。其他和 char计算方式一样。例如，varchar(20) DEFAULT NULL，编码 utf8，那么 key_len 就是：

3 × 20 + 2 + 1 = 63，如果不允许为 NULL，就是62。

上面的说明只是单独计算每种列值类型的方法，如果是复合索引，那么key_len 就是用到的索引列长度和。

9、ref（JSON 名：ref）

ref 列显示了常量或哪些列与 key 列中的索引进行了比较。只有 type 列是 ref 的时候，ref 列才会有值。

简单的说，就是 key 中的索引，如果与一个常量比较，那么 ref 会显示 const，如果是与其他表的某个列进行比较，那么就会显示该列名。

如果 ref 属性的值是 func ，那么用到的值就是某些函数的结果。想要知道是哪个函数，在 EXPLAIN 执行后使用 SHOW WARNINGS ，查看EXPLAIN 的扩展信息。

函数实际上可能是一个运算符，比如算术运算符。

10、rows（JSON 名：rows）

rows 列表示MySQL认为执行查询必须检查的行数。这个数字是内嵌关联循环计划里的循环数目。也就是说，它不是最终的结果集里的行数，而是MySQL为了找到符合条件的结果集而必须读取的行的平均数。

对于 InnoDB 表，这个数是一个估值，而且可能并不总是准确的。

11、filtered（JSON 名：filtered）

filtered 属性表示被筛选条件过滤掉的记录条数占全表的估计百分比。最大值是100，意味着记录全部被过滤掉。从100开始递减的值表示过滤的量在增加。rows 属性表示了需要检查的估计行数，rows 乘 filtered 表示了将会被后面的表关联的记录条数。例如，如果 rows 是1000，filtered 是 50.00（50%），那么要与后面的表连接的记录条数就是 1000 × 50% = 500。

对于filtered ，原文的描述是：The filtered column indicates an estimated percentage of table rows that will be filtered by the table condition. The maximum value is 100, which means no filtering of rows occurred. 这里面有一个语义上的陷阱，即 filtered 究竟表示的是 “被过滤掉的” ？还是 “过滤后(留下来)的” ，经过本人测试，filtered 表示的是前者，即 “被过滤掉的” ，这样后面的语义也就基本自洽了。而 filtering 则表示 “过滤后（留下来）的” 。

12、Extra（JSON 名：none）

这一列显示了关于 MySQL如何处理查询的额外信息。对于不同值的描述，参考：Extra Information. 或参考下面 2.3 节。

2.2 EXPLAIN type访问类型（EXPLAIN Join Types）

type 属性描述了表之间是如何连接（或关联）的。在 JSON 格式输出中，对应 access_type 属性。下面的列表描述了访问类型，顺序从“最理想类型”到“最糟糕的类型”：

system > const > eq_ref > ref > range > index > ALL

2.2.1 system（不常见）

表只有一行（=系统表）。是 const 连接类型的一种特殊情况。

2.2.2 const

表最多只有 1 条匹配记录，在查询开始时就会读取该表。因为只有一行，所以这一行中列的值可以被其他优化器视为常量。const 访问类型非常快，因为他们只会被读取一次。MySQL能将这个查询转换为一个常量，然后可以高效地将表从连接操作中移除。

const 会在你使用整个主键（all parts of a PRIMARY KEY）或唯一索引（UNIQUE index）去比较一个常量的时候用到。在下面的查询中，tb1_name 就是一张 const 表：

SELECT * FROM tbl_name WHERE primary_key=1;

SELECT * FROM tbl_name
  WHERE primary_key_part1=1 AND primary_key_part2=2;

2.2.3 eq_ref

使用这种索引查找，MySQL知道最多只返回一条符合条件的记录。它会在所有的索引部分都被用到的时候以及索引是主键或非空唯一索引时出现到，它会将它们与某个参考值做比较。MySQL 对于这类访问类型的优化做的非常好，因为MySQL知道无须估计匹配行的范围或在找到匹配行后再继续查找。

eq_ref 会在索引列使用 = 号的时候用到。比较的值可以是一个常量也可以是一个从前表读取的列（的表达式）。在下面的例子中，MySQL 可以使用 eq_ref 类型来处理 ref_table：

SELECT * FROM ref_table,other_table
  WHERE ref_table.key_column=other_table.column;

SELECT * FROM ref_table,other_table
  WHERE ref_table.key_column_part1=other_table.column
  AND ref_table.key_column_part2=1;

2.2.4 ref

这是一种索引访问（有时也叫“索引查找”），它返回所有匹配某个单个值的行，是查找和扫描的混合体。此类索引访问只有当使用非唯一性索引或唯一性索引的非唯一性前缀时才会发生。把它叫做 ref 是因为索引要跟某个参考值相比较。这个参考值可以是一个常数，或是来自多表查询的结果值。如果该筛选列可以匹配少量的记录，那 ref 还算是一个不错的连接类型。

ref_or_null 是ref 之上的一个变体，它意味着MySQL必须在初次查找的结果里进行第二次查找以找出NULL条目。

ref 也可以在索引列使用 = 或 <=> 号的时候被用到。下面的例子，MySQL 可以使用 ref 来处理 ref_table：

SELECT * FROM ref_table WHERE key_column=expr;

SELECT * FROM ref_table,other_table
  WHERE ref_table.key_column=other_table.column;

SELECT * FROM ref_table,other_table
  WHERE ref_table.key_column_part1=other_table.column
  AND ref_table.key_column_part2=1;

2.2.5 full_text（不常见）

这种连接方式会在使用 FULLTEXT 索引的时候用到。

2.2.6 ref_or_null（不常见）

这种连接方式和 ref 类似，除此之外， MySQL 还会额外搜索包含 NULL 值的记录。这种连接类型的优化绝大多数是在处理子查询的时候。在下面的例子中， MySQL 会使用 ref_or_null 来处理 ref_table：

SELECT * FROM ref_table
  WHERE key_column=expr OR key_column IS NULL;

参考：Section 8.2.1.13, “IS NULL Optimization”.

2.2.7 index_merge（不常见）

这种连接类型表示使用了索引合并优化（Index Merge optimization）。这种情况下，explain 中的 key 属性会罗列出被用到的索引，key_len 属性会列出用到的索引的最长的索引部分。参考：Section 8.2.1.3, “Index Merge Optimization”.

2.2.8 unique_subquery（不常见）

这种类型在类似下面的一些使用 IN 的子查询时取代了 eq_ref：

value IN (SELECT primary_key FROM single_table WHERE some_expr)

unique_subquery 只是一个索引查找函数，它完全取代了子查询，以提高效率。

2.2.9 index_subquery（不常见）

这种连接类型有点像 unique_subquery 。它取代了 IN 子查询，但它只在子查询中有非唯一索引时才会起作用，类似下面这样：

value IN (SELECT key_column FROM single_table WHERE some_expr)

2.2.10 range

这种连接类型会使用索引查询给定范围内的记录。EXPLAIN 输出中的 key 属性表示了哪个索引列被用到。key_len 包含了被用到的最长的索引部分。ref 属性为 NULL。

range 类型会在索引列使用 =、<>、>、>=、<、<=、IS NULL、<=>、BETWEEN、LIKE、或 IN() 任意一种操作符去比较常量的时候被用到。当使用 IN或 OR 列表的时候，显示的范围扫描，其实并不能和 > 这类比较符的性能等同，虽然它们在EXPLAIN中显示的类型都是 range，但是 IN() 列表其实属于等值列表。参考《MySQL高级 —— 高性能索引》6.2 节。

SELECT * FROM tbl_name
  WHERE key_column = 10;

SELECT * FROM tbl_name
  WHERE key_column BETWEEN 10 and 20;

SELECT * FROM tbl_name
  WHERE key_column IN (10,20,30);

SELECT * FROM tbl_name
  WHERE key_part1 = 10 AND key_part2 IN (10,20,30);

2.2.11 index

index 类型除了会扫描索引树之外，其他和 ALL 是一样的。会有两种情况出现：

1、如果索引是一个覆盖索引，那么这种类型的查询就只会扫描索引树。这种情况下， Extra 属性会显示 Using Index。一个只扫描索引的方式比 ALL 更快，这是因为索引数据肯定要比表中数据要少。

2、以索引次序扫描全表。Extra 不会显示 Uses Index。

index 类型的主要优点是避免了排序，最大缺点是要承担按索引次序读取整个表的开销。

MySQL 会在查询只用到了单一索引列的时候用到 index 这种类型。

2.2.12 ALL

这就是人们常说的“全表扫描”，这种类型会对前面各表的组合记录都进行全表扫描。如果表是第一个没有被标记为 const 的表，这通常是不好的，在所有其他情况下通常是非常糟糕的。通常你可以通过增加索引来避免 ALL 。但也有例外，例如在查询中使用了 LIMIT，或在 Extra 列中显示“Using distinct/not exists”。

2.3 EXPLAIN Extra 信息（EXPLAIN Extra Information）

Extra 属性显示了MySQL如何执行查询的额外信息。

2.3.1 Using index

此值表示MySQL将使用覆盖索引，以避免访问表。不要把覆盖索引和 type = index 访问类型混淆了。

2.3.2 Using where

这意味着MySQL服务器将在存储引擎检索行后再进行过滤。当它读取索引时，就能被存储引擎检验，因此不是所有带有 WHERE子句的查询都会显示“Using where” 。有时“Using where” 的出现就是一个暗示：查询可受益于不同的索引。

2.3.3 Using temporary

这意味着MySQL在对查询结果排序时会使用一个临时表。

2.3.4 Using filesort

这意味着MySQL会对结果使用一个外部索引排序，而不是按照索引次序从表里读取行。MySQL有两种文件排序算法，两种方式都可以在内存或磁盘上完成。EXPLAIN 不会告诉你 MySQL将使用哪一种文件排序，也不会告诉你排序会在内存里还是在磁盘上完成。

2.3.5 Range checked for each record (index map:N)

这个值意味着没有好用的索引，新的索引将在连接的每一行上重新估算。N是显示在possible_keys 列中索引的位图，并且是冗余的。

2.4 EXPLAIN 输出的解释

EXPLAIN输出可以给你在连接各种表查询的时候一个非常好的指示作用。这会大致告诉你MySQL 在执行查询的时候必须要检查多少行记录。如果你限制了 max_join_size 系统变量，那么 EXPLAIN 也会被用来告诉我们一些有用的东西。参考： Section 5.1.1, “Configuring the Server”.

下面的例子显示了多表连接是如何基于 EXPLAIN 提供的信息一点点优化的。

假设你有一个查询语句，并且你通过 EXPLAIN 来检查它：

EXPLAIN SELECT tt.TicketNumber, tt.TimeIn,
               tt.ProjectReference, tt.EstimatedShipDate,
               tt.ActualShipDate, tt.ClientID,
               tt.ServiceCodes, tt.RepetitiveID,
               tt.CurrentProcess, tt.CurrentDPPerson,
               tt.RecordVolume, tt.DPPrinted, et.COUNTRY,
               et_1.COUNTRY, do.CUSTNAME
        FROM tt, et, et AS et_1, do
        WHERE tt.SubmitTime IS NULL
          AND tt.ActualPC = et.EMPLOYID
          AND tt.AssignedPC = et_1.EMPLOYID
          AND tt.ClientID = do.CUSTNMBR;

对于这个例子，做出下面的假设：

1、比较的列（译者注：columns being compared，实际上指的就是where 子句后面作为筛选条件的列，因为往往需要用到 = 号等操作符，因此在官网中一般都被称为被比较的列）定义如下：

Table	Column	Data Type
`tt`	`ActualPC`	`CHAR(10)`
`tt`	`AssignedPC`	`CHAR(10)`
`tt`	`ClientID`	`CHAR(10)`
`et`	`EMPLOYID`	`CHAR(15)`
`do`	`CUSTNMBR`	`CHAR(15)`

2、表有以下这些索引：

Table	Index
`tt`	`ActualPC`
`tt`	`AssignedPC`
`tt`	`ClientID`
`et`	`EMPLOYID` (primary key)
`do`	`CUSTNMBR` (primary key)

3、tt 表的 ActualPC 字段不是均匀分布的。

首先，在所有优化执行之前， EXPLAIN 语句输出了下面的信息：

table type possible_keys key  key_len ref  rows  Extra
et    ALL  PRIMARY       NULL NULL    NULL 74
do    ALL  PRIMARY       NULL NULL    NULL 2135
et_1  ALL  PRIMARY       NULL NULL    NULL 74
tt    ALL  AssignedPC,   NULL NULL    NULL 3872
           ClientID,
           ActualPC
      Range checked for each record (index map: 0x23)

因为每张表的连接类型都是 ALL ，这表明MySQL 正在生成一张笛卡尔集（a Cartesian product），也就是表中的每一行都进行了组合。这会花费相当长的时间，因为必须检查每个表中行数的乘积。对于这个案例，乘积就是：74 × 2135 × 74 × 3872 = 45,268,558,720 行。如果表再大一点，你可以想象一下它需要花费多长时间。

这里有个问题，如果比较的列被声明以相同的大小和类型，那么 MySQL 就可以更高效的使用列上的索引。在这种语境下，VARCHAR 和 CHAR 如果被设定为相同的大小，那么就被认为是相同的。tt.ActualPC 被声明为 CHAR(10) 而 et.EMPLOYID 声明为 CHAR(15)，所以长度不匹配。

为了修复这种列长度的不一致，使用 ALTER TABLE 来延长 ActualPC ，从 10个字符到15个字符。

mysql> ALTER TABLE tt MODIFY ActualPC VARCHAR(15);

现在 tt.ActualPC 和 et.EMPLOYID 都是 VARCHAR(15) 了。再次执行 EXPLAIN 就会得到下面的结果：

table type   possible_keys key     key_len ref         rows    Extra
tt    ALL    AssignedPC,   NULL    NULL    NULL        3872    Using
             ClientID,                                         where
             ActualPC
do    ALL    PRIMARY       NULL    NULL    NULL        2135
      Range checked for each record (index map: 0x1)
et_1  ALL    PRIMARY       NULL    NULL    NULL        74
      Range checked for each record (index map: 0x1)
et    eq_ref PRIMARY       PRIMARY 15      tt.ActualPC 1

这依然不够完美，但是也稍微好了点：rows 的乘积少了 74 倍（译者注：et 表的 rows 由 74 变为了 1）。这一版的执行会在几秒钟完成。

第二处修改可以针对 tt.AssignedPC = et_1.EMPLOYID 和 tt.ClientID = do.SUTNMBR 这两个比较中有关列长度不匹配的问题。

mysql> ALTER TABLE tt MODIFY AssignedPC VARCHAR(15),
                      MODIFY ClientID   VARCHAR(15);

这次修改之后，EXPLAIN 输出就会变成下面这样：

table type   possible_keys key      key_len ref           rows Extra
et    ALL    PRIMARY       NULL     NULL    NULL          74
tt    ref    AssignedPC,   ActualPC 15      et.EMPLOYID   52   Using
             ClientID,                                         where
             ActualPC
et_1  eq_ref PRIMARY       PRIMARY  15      tt.AssignedPC 1
do    eq_ref PRIMARY       PRIMARY  15      tt.ClientID   1

此时，查询几乎已经优化的足够好了。遗留的问题是，默认情况下，MySQL 假设 tt.ActualPC 字段上的值是均匀分布的，但 tt 表并不是这样的（前面的假设）。幸运的是，要告诉 MySQL 分析列值分布情况是非常简单的，你只需要这样做：

mysql> ANALYZE TABLE tt;

凭借额外的索引信息，连接查询已经变得完美，EXPLAIN 也变成了如下结果：

table type   possible_keys key     key_len ref           rows Extra
tt    ALL    AssignedPC    NULL    NULL    NULL          3872 Using
             ClientID,                                        where
             ActualPC
et    eq_ref PRIMARY       PRIMARY 15      tt.ActualPC   1
et_1  eq_ref PRIMARY       PRIMARY 15      tt.AssignedPC 1
do    eq_ref PRIMARY       PRIMARY 15      tt.ClientID   1

EXPLAIN输出中的rows列是来自MySQL连接优化器的猜测。通过将 rows 的乘积与查询返回的实际行数进行比较，就可以检查这些数字是否接近实际情况。如果数字与实际查询的行数相差甚远，你可以通过在你的 SELECT 语句中使用 STRAIGHT_JOIN 并尝试在 FROM 子句中以不同的顺序罗列所查各表来获取更好的性能。（但是，STRAIGHT_JOIN 可能会妨碍到索引的使用，因为它禁用了半连接转换。参考：Section 8.2.2.1, “Optimizing Subqueries, Derived Tables, and View References with Semijoin Transformations”.）

在某些情况下，当EXPLAIN SELECT与子查询一起使用时，可以执行修改数据的语句。参考：Section 13.2.10.8, “Derived Tables”.

总结

这篇译文翻译了很长时间，断断续续可能有一个月。本篇文章有些地方可能翻译的并不准确，因此希望各位可以与原文比较阅读，增加理解。

另外，本来想在 Extra 部分就结束本篇翻译，没想到 MySQL 官网在最后一节给出了一个非常亲民的案例讲解，可以让我们一览 EXPLAIN 的常规用法。这一部分也是我认为翻译的比较准确的部分。

因为 EXPLAIN 语句非常重要，因此，这篇译文我也会经常翻阅，加深理解的同时不断纠正文中翻译的不准确或有所偏颇之处，同时希望大家能给予意见或建议。

2020-05-29 追加的部分，分散在文章的各个小节中，主要是在读完《高性能MySQL（第三版）》的五六章，以及附录EXPLAIN的部分，对执行计划和一些索引的概念有了更进一步的理解和认识。之前翻译的不是很准确的地方做了校对和润色，某些废话也是能删就删，我还写了很多关于索引及查询优化相关的文章，可以和这些文章一起阅读，结合实践并反复回看的话，相信一定可以成为MySQL性能优化领域的好手。

你可能感兴趣的:(数据库与SQL语句)

斤斤计较的婚姻到底有多难？白心之岂必有为
很多人私聊我会问到在哪个人群当中斤斤计较的人最多？我都会回答他，一般婚姻出现问题的斤斤计较的人士会非常多，以我多年经验，在婚姻落的一塌糊涂的人当中，斤斤计较的人数占比在20～30%以上，也就是说10个婚姻出现问题的斤斤计较的人有2-3个有多不减。在婚姻出问题当中，有大量的心理不平衡的、尖酸刻薄的怨妇。在婚姻中仅斤斤计较有两种类型：第一种是物质上的，另一种是精神上的。在物质与精神上抠门已经严重的影响
QQ群采集助手，精准引流必备神器 2401_87347160 其他经验分享
功能概述微信群查找与筛选工具是一款专为微信用户设计的辅助工具，它通过关键词搜索功能，帮助用户快速找到相关的微信群，并提供筛选是否需要验证的群组的功能。主要功能关键词搜索：用户可以输入关键词，工具将自动查找包含该关键词的微信群。筛选功能：工具提供筛选机制，用户可以选择是否只显示需要验证或不需要验证的群组。精准引流：通过上述功能，用户可以更精准地找到目标群组，进行有效的引流操作。3.设备需求该工具可以
机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
随笔 | 仙一般的灵气海思沧海
仙岛今天，我看了你全部，似乎已经进入你的世界我不知道，这是否是梦幻，还是你仙一般的灵气吸引了我也许每一个人都要有一份属于自己的追求，这样才能够符合人生的梦想，生活才能够充满着阳光与快乐我不知道，我为什么会这样的感叹，是在感叹自己的人生，还是感叹自己一直没有孜孜不倦的追求只感觉虚度了光阴，每天活在自己的梦中，活在一个不真实的世界是在逃避自己，还是在逃避周围的一切有时候我嘲笑自己，嘲笑自己如此的虚无，
一百九十四章. 自相矛盾巨木擎天
唉！就这么一夜，林子感觉就像过了很多天似的，先是回了阳间家里，遇到了那么多不可思议的事情儿。特别是小伙伴们，第二次与自己见面时，僵硬的表情和恐怖的气氛，让自己如坐针毡，打从心眼里难受！还有东子，他现在还好吗？有没有被人欺负？护城河里的小鱼小虾们，还都在吗？水不会真的干枯了吧？那对相亲相爱漂亮的太平鸟儿，还好吧！春天了，到了做窝、下蛋、喂养小鸟宝宝的时候了，希望它们都能够平安啊！虽然没有看见家人，也
微服务下功能权限与数据权限的设计与实现 nbsaas-boot 微服务 java 架构
在微服务架构下，系统的功能权限和数据权限控制显得尤为重要。随着系统规模的扩大和微服务数量的增加，如何保证不同用户和服务之间的访问权限准确、细粒度地控制，成为设计安全策略的关键。本文将讨论如何在微服务体系中设计和实现功能权限与数据权限控制。1.功能权限与数据权限的定义功能权限：指用户或系统角色对特定功能的访问权限。通常是某个用户角色能否执行某个操作，比如查看订单、创建订单、修改用户资料等。数据权限：
学点心理知识，呵护孩子健康静候花开_7090
昨天听了华中师范大学教育管理学系副教授张玲老师的《哪里才是学生心理健康的最后庇护所，超越教育与技术的思考》的讲座。今天又重新学习了一遍，收获匪浅。张玲博士也注意到了当今社会上的孩子由于心理问题导致的自残、自杀及伤害他人等恶性事件。她向我们普及了一个重要的命题，她说心理健康的一些基本命题，我们与我们通常的一些教育命题是不同的，她还举了几个例子，让我们明白我们原来以为的健康并非心理学上的健康。比如如果
《投行人生》读书笔记小蘑菇的树洞
《投行人生》----作者詹姆斯-A-朗德摩根斯坦利副主席40年的职业洞见-很短小精悍的篇幅，比较适合初入职场的新人。第一部分成功的职业生涯需要规划1.情商归为适应能力分享与协作同理心适应能力，更多的是自我意识，你有能力识别自己的情并分辨这些情绪如何影响你的思想和行为。2.对于初入职场的人的建议，细节，截止日期和数据很重要截止日期，一种有效的方法是请老板为你所有的任务进行优先级排序。和老板喝咖啡的好
Long类型前后端数据不一致 igotyback 前端
响应给前端的数据浏览器控制台中response中看到的Long类型的数据是正常的到前端数据不一致前后端数据类型不匹配是一个常见问题，尤其是当后端使用Java的Long类型（64位）与前端JavaScript的Number类型（最大安全整数为2^53-1，即16位）进行数据交互时，很容易出现精度丢失的问题。这是因为JavaScript中的Number类型无法安全地表示超过16位的整数。为了解决这个问
店群合一模式下的社区团购新发展——结合链动 2+1 模式、AI 智能名片与 S2B2C 商城小程序源码说私域人工智能小程序
摘要：本文探讨了店群合一的社区团购平台在当今商业环境中的重要性和优势。通过分析店群合一模式如何将互联网社群与线下终端紧密结合，阐述了链动2+1模式、AI智能名片和S2B2C商城小程序源码在这一模式中的应用价值。这些创新元素的结合为社区团购带来了新的机遇，提升了用户信任感、拓展了营销渠道，并实现了线上线下的完美融合。一、引言随着互联网技术的不断发展，社区团购作为一种新兴的商业模式，在满足消费者日常需
2021-08-26 影幽
在生活中，女人与男人的感悟往往有所不同。人生最大的舞台就是生活，大幕随时都可能拉开，关键是你愿不愿意表演都无法躲避。在生活中，遇事不要急躁，不要急于下结论，尤其生气时不要做决断，要学会换位思考，大事化小小事化了，把复杂的事情尽量简单处理，千万不要把简单的事情复杂化。永远不要扭曲，别人善意，无药可救。昨天是张过期的支票，明天是张信用卡，只有今天才是现金，要善加利用！执着的攀登者不必去与别人比较自己的
高级编程--XML+socket练习题 masa010 java 开发语言
1.北京华北2114.8万人上海华东2,500万人广州华南1292.68万人成都华西1417万人（1）使用dom4j将信息存入xml中（2）读取信息，并打印控制台（3）添加一个city节点与子节点（4）使用socketTCP协议编写服务端与客户端，客户端输入城市ID，服务器响应相应城市信息（5）使用socketTCP协议编写服务端与客户端，客户端要求用户输入city对象，服务端接收并使用dom4j
2018-07-23-催眠日作业-#不一样的31天#-66小鹿小鹿_33
预言日：人总是在逃避命运的路上，与之不期而遇。心理学上有个著名的名词，叫做自证预言；经济学上也有一个很著名的定律叫做，墨菲定律；在灵修派上，还有一个很著名的法则，叫做吸引力法则。这3个领域的词，虽然看起来不太一样，但是他们都在告诉人们一个现象：你越担心什么，就越有可能会发生什么。同样的道理，你越想得到什么，就应该要积极地去创造什么。无论是自证预言，墨菲定律还是吸引力法则，对人都有正反2个维度的影响
回溯 Leetcode 332 重新安排行程 mmaerd Leetcode刷题学习记录 leetcode 算法职场和发展
重新安排行程Leetcode332学习记录自代码随想录给你一份航线列表tickets，其中tickets[i]=[fromi,toi]表示飞机出发和降落的机场地点。请你对该行程进行重新规划排序。所有这些机票都属于一个从JFK（肯尼迪国际机场）出发的先生，所以该行程必须从JFK开始。如果存在多种有效的行程，请你按字典排序返回最小的行程组合。例如，行程[“JFK”,“LGA”]与[“JFK”,“LGB
每日一题——第九十题互联网打工人no1 C语言程序设计每日一练 c语言
题目：判断子串是否与主串匹配#include#include#include//////判断子串是否在主串中匹配//////主串///子串///boolisSubstring(constchar*str,constchar*substr){intlenstr=strlen(str);//计算主串的长度intlenSub=strlen(substr);//计算子串的长度//遍历主字符串，对每个可能得
Python数据分析与可视化实战指南 William数据分析 python python 数据
在数据驱动的时代，Python因其简洁的语法、强大的库生态系统以及活跃的社区，成为了数据分析与可视化的首选语言。本文将通过一个详细的案例，带领大家学习如何使用Python进行数据分析，并通过可视化来直观呈现分析结果。一、环境准备1.1安装必要库在开始数据分析和可视化之前，我们需要安装一些常用的库。主要包括pandas、numpy、matplotlib和seaborn等。这些库分别用于数据处理、数学
《庄子.达生9》钱江潮369
【原文】孔子观于吕梁，县水三十仞，流沫四十里，鼋鼍鱼鳖之所不能游也。见一丈夫游之，以为有苦而欲死也，使弟子并流而拯之。数百步而出，被发行歌而游于塘下。孔子从而问焉，曰：“吾以子为鬼，察子则人也。请问，‘蹈水有道乎’”曰：“亡，吾无道。吾始乎故，长乎性，成乎命。与齐俱入，与汩偕出，从水之道而不为私焉。此吾所以蹈之也。”孔子曰：“何谓始乎故，长乎性，成乎命？”曰：“吾生于陵而安于陵，故也；长于水而安于
水泥质量纠纷案代理词徐宝峰律师
贵州领航建设有限公司诉贵州纳雍隆庆乌江水泥有限公司产品质量纠纷案代理词尊敬的审判长、审判员：贵州千里律师事务所接受被告贵州纳雍隆庆乌江水泥有限公司的委托，指派我担任其诉讼代理人，参加本案的诉讼活动。下面，我结合本案事实和相关法律规定发表如下代理意见，供合议庭评议案件时参考：原告应当举证证明其遭受的损失与被告生产的水泥质量的因果关系。首先水泥是一种粉状水硬性无机胶凝材料。加水搅拌后成浆体，能在空气中
Goolge earth studio 进阶4——路径修改与平滑陟彼高冈yu Google earth studio 进阶教程旅游
如果我们希望在大约中途时获得更多的城市鸟瞰视角。可以将相机拖动到这里并创建一个新的关键帧。camera_target_clip_7EarthStudio会自动平滑我们的路径，所以当我们通过这个关键帧时，不是一个生硬的角度，而是一个平滑的曲线。camera_target_clip_8路径上有贝塞尔控制手柄，允许我们调整路径的形状。右键单击，我们可以选择“平滑路径”，这是默认的自动平滑算法，或者我们可
Google earth studio 简介陟彼高冈yu 旅游
GoogleEarthStudio是一个基于Web的动画工具，专为创作使用GoogleEarth数据的动画和视频而设计。它利用了GoogleEarth强大的三维地图和卫星影像数据库，使用户能够轻松地创建逼真的地球动画、航拍视频和动态地图可视化。网址为https://www.google.com/earth/studio/。GoogleEarthStudio是一个基于Web的动画工具，专为创作使用G
关于提高复杂业务逻辑代码可读性的思考编程经验分享开发经验 java 数据库开发语言
目录前言需求场景常规写法拆分方法领域对象总结前言实际工作中大部分时间都是在写业务逻辑，一般都是三层架构，表示层（Controller）接收客户端请求，并对入参做检验，业务逻辑层（Service）负责处理业务逻辑，一般开发都是在这一层中写具体的业务逻辑。数据访问层（Dao）是直接和数据库交互的，用于查数据给业务逻辑层，或者是将业务逻辑层处理后的数据写入数据库。简单的增删改查接口不用多说，基本上写好一
18-115 一切思考不能有效转化为行动，都TM是扯淡！成长时间线
7月25号写了一篇关于为什么会断更如此严重的反思，然而，之后日更仅仅维持了一周，又出现了这次更严重的现象。从8月2号到昨天8月6号，5天！又是5天没有更文！虽然这次断更时间和上次一样，那为什么说这次更严重？因为上次之后就分析了问题的原因，以及应该如何解决，按理说应该会好转，然而，没过几天严重断更的现象再次出现，想想，经过反思，问题依然没有解决与改变，这让我有些担忧。到底是哪里出了问题，难道我就真的
山东大学小树林支教调研团青青仓木队——翟晓楠山东大学青青仓木队
过了半年，又一次启程，又一次回到支教的初心之地。比起上一次的试探与不安，我更多了一丝稳重与熟练。心境、处境也都随着半个学期的过去而变得不同，半个学期中，身体上的，心理上的，太多的逆境让我变得步履维艰，曲曲折折，弯弯绕绕，我仿佛打不起精神，没有胃口，没有动力。感觉走的不顺畅的时候，支教这个旅程，给了我力量。自告奋勇承担起队长这一职务的我，从组织时的复杂和困难的经历，协调各种问题，从无到有，和校长和队
直返最高等级与直返APP：无需邀请码的返利新体验古楼
随着互联网的普及和电商的兴起，直返模式逐渐成为一种流行的商业模式。在这种模式下，消费者通过购买产品或服务，获得一定的返利，并可以分享给更多的人。其中，直返最高等级和直返APP是直返模式中的重要概念和工具。本文将详细介绍直返最高等级的概念、直返APP的使用以及与邀请码的关系。【高省】APP（高佣金领导者）是一个自用省钱佣金高，分享推广赚钱多的平台，百度有几百万篇报道，运行三年，稳定可靠。高省APP，
SQL Server_查询某一数据库中的所有表的内容 qq_42772833 SQL Server 数据库 sqlserver
1.查看所有表的表名要列出CrabFarmDB数据库中的所有表（名），可以使用以下SQL语句：USECrabFarmDB;--切换到目标数据库GOSELECTTABLE_NAMEFROMINFORMATION_SCHEMA.TABLESWHERETABLE_TYPE='BASETABLE';对这段SQL脚本的解释：SELECTTABLE_NAME：这个语句的作用是从查询结果中选择TABLE_NAM
DIV+CSS+JavaScript技术制作网页（旅游主题网页设计与制作）云南大理 STU学生网页设计网页设计期末网页作业 html静态网页 html5期末大作业网页设计 web大作业
️精彩专栏推荐作者主页:【进入主页—获取更多源码】web前端期末大作业：【HTML5网页期末作业(1000套)】程序员有趣的告白方式：【HTML七夕情人节表白网页制作(110套)】文章目录二、网站介绍三、网站效果▶️1.视频演示2.图片演示四、网站代码HTML结构代码CSS样式代码五、更多源码二、网站介绍网站布局方面：计划采用目前主流的、能兼容各大主流浏览器、显示效果稳定的浮动网页布局结构。网站程
2020-04-12每天三百字之连接与替代冷眼看潮
不知道是不是好为人师，有时候还真想和别人分享一下我对某些现象的看法或者解释。人类社会不断发展进步的过程，就是不断连接与替代的过程。人类发现了火并应用火以后，告别了茹毛饮血的野兽般的原始生活（火烧、烹饪替代了生食）人类用石器代替了完全手工，工具的使用使人类进步一大步。类似这样的替代还有很多，随着科技的发展，有更多的原始的事物被替代，代之以更高效、更先进的技术。在近现代，汽车替代了马车，高速公路和铁路
探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
利用Requests Toolkit轻松完成HTTP请求 nseejrukjhad http 网络协议网络 python
RequestsToolkit的力量：轻松构建HTTP请求Agent在现代软件开发中，API请求是与外部服务交互的核心。RequestsToolkit提供了一种便捷的方式，帮助开发者构建自动化的HTTP请求Agent。本文旨在详细介绍RequestsToolkit的设置、使用和潜在挑战。引言RequestsToolkit是一个强大的工具包，可用于构建执行HTTP请求的智能代理。这对于想要自动化与外
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
Enum用法不懂事的小屁孩 enum
以前的时候知道enum，但是真心不怎么用，在实际开发中，经常会用到以下代码: protected final static String XJ = "XJ"; protected final static String YHK = "YHK"; protected final static String PQ = "PQ";
【Spark九十七】RDD API之aggregateByKey bit1129 spark
1. aggregateByKey的运行机制 /** * Aggregate the values of each key, using given combine functions and a neutral "zero value". * This function can return a different result type
hive创建表是报错： Specified key was too long; max key length is 767 bytes daizj hive
今天在hive客户端创建表时报错，具体操作如下 hive> create table test2(id string); FAILED: Execution Error, return code 1 from org.apache.hadoop.hive.ql.exec.DDLTask. MetaException(message:javax.jdo.JDODataSto
Map 与 JavaBean之间的转换周凡杨 java 自省转换反射
最近项目里需要一个工具类，它的功能是传入一个Map后可以返回一个JavaBean对象。很喜欢写这样的Java服务，首先我想到的是要通过Java 的反射去实现匿名类的方法调用，这样才可以把Map里的值set 到JavaBean里。其实这里用Java的自省会更方便，下面两个方法就是一个通过反射，一个通过自省来实现本功能。 1：JavaBean类 1 &nb
java连接ftp下载 g21121 java
有的时候需要用到java连接ftp服务器下载，上传一些操作，下面写了一个小例子。 /** ftp服务器地址 */ private String ftpHost; /** ftp服务器用户名 */ private String ftpName; /** ftp服务器密码 */ private String ftpPass; /** ftp根目录 */ private String f
web报表工具FineReport使用中遇到的常见报错及解决办法（二）老A不折腾 finereport web报表 java报表总结
抛砖引玉，希望大家能把自己整理的问题及解决方法晾出来，Mark一下，利人利己。出现问题先搜一下文档上有没有，再看看度娘有没有，再看看论坛有没有。有报错要看日志。下面简单罗列下常见的问题，大多文档上都有提到的。 1、没有返回数据集：在存储过程中的操作语句之前加上set nocount on 或者在数据集exec调用存储过程的前面加上这句。当S
linux 系统cpu 内存等信息查看墙头上一根草 cpu 内存 liunx
1 查看CPU 　　1.1 查看CPU个数　　# cat /proc/cpuinfo | grep "physical id" | uniq | wc -l 　　2 　　**uniq命令：删除重复行;wc –l命令：统计行数** 　　1.2 查看CPU核数　　# cat /proc/cpuinfo | grep "cpu cores" | u
Spring中的AOP aijuans spring AOP
Spring中的AOP Written by Tony Jiang @ 2012-1-18 （转）何为AOP AOP，面向切面编程。在不改动代码的前提下，灵活的在现有代码的执行顺序前后，添加进新规机能。来一个简单的Sample: 目标类： [java] view plain copy print ? package&nb
placeholder(HTML 5) IE 兼容插件 alxw4616 JavaScript jquery jQuery插件
placeholder 这个属性被越来越频繁的使用. 但为做HTML 5 特性IE没能实现这东西. 以下的jQuery插件就是用来在IE上实现该属性的. /** * [placeholder(HTML 5) IE 实现.IE9以下通过测试.] * v 1.0 by oTwo 2014年7月31日 11:45:29 */ $.fn.placeholder = function
Object类,值域,泛型等总结(适合有基础的人看) 百合不是茶泛型的继承和通配符变量的值域 Object类转换
java的作用域在编程的时候经常会遇到,而我经常会搞不清楚这个问题,所以在家的这几天回忆一下过去不知道的每个小知识点变量的值域; package 基础; /** * 作用域的范围 * * @author Administrator * */ public class zuoyongyu { public static vo
JDK1.5 Condition接口 bijian1013 java thread Condition java多线程
Condition 将 Object 监视器方法（wait、notify和 notifyAll）分解成截然不同的对象，以便通过将这些对象与任意 Lock 实现组合使用，为每个对象提供多个等待 set （wait-set）。其中，Lock 替代了 synchronized 方法和语句的使用，Condition 替代了 Object 监视器方法的使用。条件（也称为条件队列或条件变量）为线程提供了一
开源中国OSC源创会记录 bijian1013 hadoop spark MemSQL
一.Strata+Hadoop World（SHW）大会是全世界最大的大数据大会之一。SHW大会为各种技术提供了深度交流的机会，还会看到最领先的大数据技术、最广泛的应用场景、最有趣的用例教学以及最全面的大数据行业和趋势探讨。二.Hadoop &nbs
【Java范型七】范型消除 bit1129 java
范型是Java1.5引入的语言特性，它是编译时的一个语法现象，也就是说，对于一个类，不管是范型类还是非范型类，编译得到的字节码是一样的，差别仅在于通过范型这种语法来进行编译时的类型检查，在运行时是没有范型或者类型参数这个说法的。范型跟反射刚好相反，反射是一种运行时行为，所以编译时不能访问的变量或者方法(比如private)，在运行时通过反射是可以访问的，也就是说，可见性也是一种编译时的行为，在
【Spark九十四】spark-sql工具的使用 bit1129 spark
spark-sql是Spark bin目录下的一个可执行脚本，它的目的是通过这个脚本执行Hive的命令，即原来通过 hive>输入的指令可以通过spark-sql>输入的指令来完成。 spark-sql可以使用内置的Hive metadata-store，也可以使用已经独立安装的Hive的metadata store 关于Hive build into Spark
js做的各种倒计时 ronin47 js 倒计时
第一种：精确到秒的javascript倒计时代码 HTML代码: <form name="form1"> <div align="center" align="middle"
java-37.有n 个长为m+1 的字符串，如果某个字符串的最后m 个字符与某个字符串的前m 个字符匹配，则两个字符串可以联接 bylijinnan java
public class MaxCatenate { /* * Q.37 有n 个长为m+1 的字符串，如果某个字符串的最后m 个字符与某个字符串的前m 个字符匹配，则两个字符串可以联接， * 问这n 个字符串最多可以连成一个多长的字符串，如果出现循环，则返回错误。 */ public static void main(String[] args){
mongoDB安装开窍的石头 mongodb安装基本操作
mongoDB的安装 1:mongoDB下载 https://www.mongodb.org/downloads 2:下载mongoDB下载后解压
[开源项目]引擎的关键意义 comsci 开源项目
一个系统，最核心的东西就是引擎。。。。。而要设计和制造出引擎，最关键的是要坚持。。。。。。现在最先进的引擎技术，也是从莱特兄弟那里出现的，但是中间一直没有断过研发的
软件度量的一些方法 cuiyadll 方法
软件度量的一些方法http://cuiyingfeng.blog.51cto.com/43841/6775/在前面我们已介绍了组成软件度量的几个方面。在这里我们将先给出关于这几个方面的一个纲要介绍。在后面我们还会作进一步具体的阐述。当我们不从高层次的概念级来看软件度量及其目标的时候，我们很容易把这些活动看成是不同而且毫不相干的。我们现在希望表明他们是怎样恰如其分地嵌入我们的框架的。也就是我们度量的
XSD中的targetNameSpace解释 darrenzhu xml namespace xsd targetnamespace
参考链接: http://blog.csdn.net/colin1014/article/details/357694 xsd文件中定义了一个targetNameSpace后，其内部定义的元素，属性，类型等都属于该targetNameSpace,其自身或外部xsd文件使用这些元素，属性等都必须从定义的targetNameSpace中找：例如：以下xsd文件，就出现了该错误，即便是在一
什么是RAID0、RAID1、RAID0+1、RAID5，等磁盘阵列模式? dcj3sjt126com raid
RAID 1又称为Mirror或Mirroring，它的宗旨是最大限度的保证用户数据的可用性和可修复性。 RAID 1的操作方式是把用户写入硬盘的数据百分之百地自动复制到另外一个硬盘上。由于对存储的数据进行百分之百的备份，在所有RAID级别中，RAID 1提供最高的数据安全保障。同样，由于数据的百分之百备份，备份数据占了总存储空间的一半，因而，Mirror的磁盘空间利用率低，存储成本高。 Mir
yii2 restful web服务快速入门 dcj3sjt126com PHP yii2
快速入门 Yii 提供了一整套用来简化实现 RESTful 风格的 Web Service 服务的 API。特别是，Yii 支持以下关于 RESTful 风格的 API：支持 Active Record 类的通用API的快速原型涉及的响应格式（在默认情况下支持 JSON 和 XML) 支持可选输出字段的定制对象序列化适当的格式的数据采集和验证错误
MongoDB查询(3)——内嵌文档查询（七） eksliang MongoDB查询内嵌文档 MongoDB查询内嵌数组
MongoDB查询内嵌文档转载请出自出处：http://eksliang.iteye.com/blog/2177301 一、概述有两种方法可以查询内嵌文档：查询整个文档；针对键值对进行查询。这两种方式是不同的，下面我通过例子进行分别说明。二、查询整个文档例如:有如下文档 db.emp.insert({ &qu
android4.4从系统图库无法加载图片的问题 gundumw100 android
典型的使用场景就是要设置一个头像，头像需要从系统图库或者拍照获得，在android4.4之前，我用的代码没问题，但是今天使用android4.4的时候突然发现不灵了。baidu了一圈，终于解决了。下面是解决方案： private String[] items = new String[] { "图库","拍照" }; /* 头像名称 */
网页特效大全 jQuery等 ini JavaScript jquery css html5 ini
HTML5和CSS3知识和特效 asp.net ajax jquery实例分享一个下雪的特效 jQuery倾斜的动画导航菜单选美大赛示例你会选谁 jQuery实现HTML5时钟功能强大的滚动播放插件JQ-Slide 万圣节快乐！！！向上弹出菜单jQuery插件 htm5视差动画 jquery将列表倒转顺序推荐一个jQuery分页插件 jquery animate
swift objc_setAssociatedObject block(version1.2 xcode6.4) 啸笑天 version
import UIKit class LSObjectWrapper: NSObject { let value: ((barButton: UIButton?) -> Void)? init(value: (barButton: UIButton?) -> Void) { self.value = value
Aegis 默认的 Xfire 绑定方式，将 XML 映射为 POJO MagicMa_007 java POJO xml Aegis xfire
Aegis 是一个默认的 Xfire 绑定方式，它将 XML 映射为 POJO, 支持代码先行的开发.你开发服务类与 POJO,它为你生成 XML schema/wsdl XML 和注解映射概览默认情况下，你的 POJO 类被是基于他们的名字与命名空间被序列化。如果
js get max value in (json) Array qiaolevip 每天进步一点点学习永无止境 max 纵观千象
// Max value in Array var arr = [1,2,3,5,3,2];Math.max.apply(null, arr); // 5 // Max value in Jaon Array var arr = [{"x":"8/11/2009","y":0.026572007},{"x"
XMLhttpRequest 请求 XML,JSON ,POJO 数据 Luob. POJO json Ajax xml XMLhttpREquest
在使用XMlhttpRequest对象发送请求和响应之前，必须首先使用javaScript对象创建一个XMLHttpRquest对象。 var xmlhttp； function getXMLHttpRequest(){ if(window.ActiveXObject){ xmlhttp:new ActiveXObject("Microsoft.XMLHTTP
jquery wuai jquery
以下防止文档在完全加载之前运行Jquery代码，否则会出现试图隐藏一个不存在的元素、获得未完全加载的图像的大小等等 $(document).ready(function(){ jquery代码; }); <script type="text/javascript" src="c:/scripts/jquery-1.4.2.min.js&quo