Mysql 7种join连接方式深入分析

一,定义:

1)LEFT JOIN / LEFT OUTER JOIN:左外连接

左向外连接的结果集包括:LEFT OUTER子句中指定的左表的所有行,而不仅仅是连接列所匹配的行。如果左表的某行在右表中没有匹配行,则在相关联的结果集行中右表的所有选择列表列均为空值。

2)RIGHT JOIN / RIGHT OUTER JOIN:右外连接

右向外连接是左向外联接的反向连接。将返回右表的所有行。如果右表的某行在左表中没有匹配行,则将为左表返回空值。

3)FULL JOIN / FULL OUTER JOIN:全外连接

全外连接返回左表和右表中的所有行。当某行在另一个表中没有匹配行时,则另一个表的选择列表列包含空值。如果表之间有匹配行,则整个结果集行包含基表的数据值

 

 

二,演示:

1,内连接

SELECT FROM TABLEA A INNER JOIN TABLEB B ON A.key=B.key

 

2,全外连接 Mysql暂不支持

SELECT FROM TABLEA A FULL OUTER JOIN TABLEB B ON A.key=B.key

 

3,全外连接-差集 Mysql暂不支持

SELECT FROM TABLEA A FULL OUTER JOIN TABLEB B ON A.key=B.key WHERE A.key IS NULL OR B.key IS NULL

 

4,左(外)连接

SELECT FROM TABLEA A LEFT JOIN TABLEB B ON A.key=B.key

 

5,左(外)连接-左表无连接部分

SELECT FROM TABLEA A LEFT JOIN TABLEB B ON A.key=B.key WHERE B.key IS NULL

 

6,右(外)连接

SELECT FROM TABLEA A RIGHT JOIN TABLEB B ON A.key=B.key

 

7,右(外)连接-右表无连接部分

SELECT FROM TABLEA A RIGHT JOIN TABLEB B ON A.key=B.key WHERE A.key IS NULL

 

三,外连接消除:

 

把外连接变为内连接

A OUTER JOIN B

变形为

A JOIN B

 

外连接消除的意义:

1 查询优化器在处理外连接操作时所需执行的操作和时间多于内连接

2 外连接消除后,优化器在选择多表连接顺序时,可以有更多更灵活的选择,从而可以选择更好的表连接顺序,加快查询执行的速度

3 表的一些连接算法(如块嵌套连接和索引循环连接等)在将规模小的或筛选条件最严格的表作为“外表”(放在连接顺序的最前面,是多层循环体的外循环层),可以减少不必要的I/O开销,能加快算法执行的速度

 

外连接消除的条件

WHERE子句中的条件满足“空值拒绝” (又称为“reject-NULL”条件)。

WHERE条件 可以保证 从结果中 排除外连接右侧(右表)生成的值为NULL的行(即条件确保应用在右表带有空值的列对象上时,条件不满足,条件的结果值为FLASE或UNKONOWEN,这样右表就不会有值为NULL的行生成),所以能使该查询在语义上等效于内连接

explain

SELECT * FROM X LEFT JOIN Y ON (X.X_num=Y.Y_num)

WHERE Y.Y_num IS NOT NULL;

 

Mysql优化器对外连接的优化处理:

例1

explain extended select * from a left join b on a.id=b.uid where a.id=b.uid;

优化后:

select `test`.`a`.`id` AS `id`,`test`.`a`.`name` AS `name`,`test`.`a`.`age` AS `age`,`test`.`b`.`uid` AS `uid`,`test`.`b`.`score` AS `score`,`test`.`b`.`class` AS `class` from `test`.`a` join `test`.`b` where (`test`.`b`.`uid` = `test`.`a`.`id`)

 

例2

explain extended select * from a left join b on a.id=b.uid where b.uid is not null;

优化后:

select `test`.`a`.`id` AS `id`,`test`.`a`.`name` AS `name`,`test`.`a`.`age` AS `age`,`test`.`b`.`uid` AS `uid`,`test`.`b`.`score` AS `score`,`test`.`b`.`class` AS `class` from `test`.`a` join `test`.`b` where ((`test`.`b`.`uid` = `test`.`a`.`id`) and (`test`.`a`.`id` is not null))

 

例3

select * from a left join b on a.id=b.uid;

select * from a left outer join b on a.id=b.uid where a.id=b.uid;

select * from a left join b on true where a.id=b.uid;

这2名sql,Mysql处理后,都优化成内连接

select `test`.`a`.`id` AS `id`,`test`.`a`.`name` AS `name`,`test`.`a`.`age` AS `age`,`test`.`b`.`uid` AS `uid`,`test`.`b`.`score` AS `score`,`test`.`b`.`class` AS `class` from `test`.`a` join `test`.`b` where (`test`.`b`.`uid` = `test`.`a`.`id`)

 

 

外连接消除示例1:---辨析ON和WHERE的差异

ON   t_1_id = t_2_id:

   t_1_id 和 t_2_id 进行连接

WHERE t_1_id = t_2_id:

   当t_1_id 和 t_2_id的值相等

 

外连接消除示例2:---深入理解WHERE条件对外连接优化的影响

外表的索引列出现在WHERE子句中:

EXPLAIN EXTENDED SELECT * FROM t_1 LEFT JOIN t_2 ON t_1_id = t_2_id WHERE t_1_id>0;

优化后

select `tt2`.`t_1`.`t_1_id` AS `t_1_id`,

  `tt2`.`t_1`.`t_1_col_1` AS `t_1_col_1`,

  `tt2`.`t_1`.`t_1_col_2` AS `t_1_col_2`,`tt2`.`t_2`.`t_2_id` AS `t_2_id`,

  `tt2`.`t_2`.`t_2_col_1` AS `t_2_col_1`,`tt2`.`t_2`.`t_2_col_2` AS `t_2_col_2`

from `tt2`.`t_1` left join `tt2`.`t_2`on((`tt2`.`t_2`.`t_2_id` = `tt2`.`t_1`.`t_1_id`))

where (`tt2`.`t_1`.`t_1_id` > 0)

 

内表的索引列出现在WHERE子句中:

EXPLAIN EXTENDED SELECT * FROM t_1 LEFT JOIN t_2 ON t_1_id = t_2_id WHERE t_2_id>0;

优化后

select `tt2`.`t_1`.`t_1_id` AS `t_1_id`,

  `tt2`.`t_1`.`t_1_col_1` AS `t_1_col_1`,`tt2`.

  `t_1`.`t_1_col_2` AS `t_1_col_2`,`tt2`.`t_2`.`t_2_id` AS `t_2_id`,

  `tt2`.`t_2`.`t_2_col_1` AS `t_2_col_1`,`tt2`.`t_2`.`t_2_col_2` AS `t_2_col_2`

from `tt2`.`t_1` join `tt2`.`t_2`

where ((`tt2`.`t_2`.`t_2_id` = `tt2`.`t_1`.`t_1_id`) and

 (`tt2`.`t_1`.`t_1_id` > 0))

 

外连接消除总结:

1 注意外连接与内连接的语义差别

2 外连接优化的条件:空值拒绝

3 外连接优化的本质:语义上是外连接,但WHER条件 使得 外连接可以蜕化为内连接

 

 

 

四,连接消除:

   去掉不必要的连接对象,则减少了连接操作

 

连接消除的条件:

    无固定模式,具体问题具体处理

 

连接消除情况一:

   唯一键/主键作为连接条件,三表内连接可以去掉中间表

(中间表的列只作为连接条件)

CREATE TABLE A (a1 INT UNIQUE, a2 VARCHAR(9), a3 INT);

CREATE TABLE B (b1 INT UNIQUE, b2 VARCHAR(9), c2 INT);

CREATE TABLE C (c1 INT UNIQUE, c2 VARCHAR(9), c3 INT);

B的列在WHERE条件子句中只作为等值连接条件存在,则查询可以去掉对B的连接操作:

    SELECT A.*, C.* FROM A JOIN B ON (a1=b1) JOIN CON (b1=c1);

相当于:

    SELECT A.*, C.* FROM A JOIN C ON (a1= c1);

 

连接消除情况二:

   一些特殊形式,可以消除连接操作(可消除的表除了作为连接对象外,不出现在任何子句中)。

示例:

SELECT MAX(a1) FROM A, B;/* 在这样格式中的MIN、MAX函数操作可以消除连接,去掉B表不影响结果;其他聚集函数不可以 */

SELECT DISTINCT a3 FROM A, B; /* 对连接结果中的a3列执行去重操作*/

SELECT a1 FROM A, B GROUP BY a1;/* 对连接结果中的a1列执行分组操作 */

 

连接消除情况三:

   主外键关系的表进行的连接,可消除主键表,这不会影响对外键表的查询。

 

连接消除示例:---创建对象

创建表,命令如下:

CREATE TABLE B (b1 INT, b2 VARCHAR(2), PRIMARY KEY(b1));

CREATE TABLE A (a1 INT, a2 VARCHAR(2), FOREIGN KEY(a1) REFERENCES B(b1) );/* A作为外键表参照主键表B */

CREATE TABLE C (c1 INT, c2 VARCHAR(2));

插入数据,命令如下:

INSERT INTO B VALUES(1, 'B1');

INSERT INTO B VALUES(2, 'B2');

INSERT INTO B VALUES(3, 'B3');

INSERT INTO A VALUES(1, 'A1');

INSERT INTO A VALUES(null, 'A2');

INSERT INTO A VALUES(3, 'A3');

INSERT INTO C VALUES(1, 'C1');

INSERT INTO C VALUES(2, 'C2');

INSERT INTO C VALUES(NULL, 'C3');

 

连接消除示例1:---对主外键参照的表进行内连接,可以消除主键表 MySQL不支持

 

第一条SQL:

三个表做内连接,但目标列不包括主键表B的对象,主键表B只作为连接对象和连接条件存在;

mysql> SELECT A.*, C.* FROM A,B,C WHERE A.a1=B.b1 AND B.b1=C.c1; //主键表B作为连接对象和连接条件存在

+------+------+------+------+

| a1   | a2   | c1   | c2   |

+------+------+------+------+

|    1 | A1   |    1 | C1   |

+------+------+------+------+

1 row in set (0.05 sec)

 

连接消除示例1:---对主外键参照的表进行内连接,可以消除主键表 MySQL不支持

第一条SQL:

三个表做内连接,但目标列不包括主键表B的对象,主键表B只作为连接对象和连接条件存在;

 

mysql> EXPLAIN EXTENDED SELECT A.*, C.* FROM A,B,C WHERE A.a1=B.b1 AND B.b1=C.c1;

+----+-------------+-------+--------+---------------+---------+---------+------+

| id | select_type | table | type   | possible_keys | key     | key_len | ref      |

+----+-------------+-------+--------+---------------+---------+---------+------+

|  1 | SIMPLE      | C     | ALL    | NULL          | NULL    | NULL    | NULL     |

|  1 | SIMPLE      | B     | eq_ref | PRIMARY       | PRIMARY | 4       | test.C.c1|

|  1 | SIMPLE      | A     | ALL    | a1            | NULL    | NULL    | NULL     |

+----+-------------+-------+--------+---------------+---------+---------+------+

 

 

连接消除示例1:---对主外键参照的表进行内连接,可以消除主键表 MySQL不支持

第一条SQL:

三个表做内连接,但目标列不包括主键表B的对象,主键表B只作为连接对象和连接条件存在;

 

被查询优化器处理后的语句为:

/* select#1 */ select `test`.`a`.`a1` AS `a1`, `test`.`a`.`a2` AS `a2`,

  `  test`.`c`.`c1` AS `c1`,  `test`.`c`.`c2` AS `c2`

from `test`.`a` join `test`.`b` join `test`.`c`

where ((`test`.`b`.`b1` = `test`.`c`.`c1`) and (`test`.`a`.`a1` = `test`.`c`.`c1`))

 

 

连接消除示例1:---对主外键参照的表进行内连接,可以消除主键表 MySQL不支持

第二条SQL:

只有表A和表C进行连接,但WHERE子句多一条判定条件“A.a1 IS NOT NULL”;

 

mysql> SELECT A.*, C.* FROM A,C WHERE A.a1=C.c1 AND A.a1 IS NOT NULL; //只有表A和C进行连接

+------+------+------+------+

| a1   | a2   | c1   | c2   |

+------+------+------+------+

|    1 | A1   |    1 | C1   |

+------+------+------+------+

1 row in set (0.01 sec)

 

 

连接消除示例1:---对主外键参照的表进行内连接,可以消除主键表 MySQL不支持

第二条SQL:

只有表A和表C进行连接,但WHERE子句多一条判定条件“A.a1 IS NOT NULL”;

 

查询执行计划如下:

mysql> EXPLAIN EXTENDED SELECT A.*, C.* FROM A,C WHERE A.a1=C.c1 AND A.a1 IS NOT NULL;

+----+-------------+-------+------+---------------+------+---------+-----------+

| id | select_type | table | type | possible_keys | key  | key_len | ref       |

+----+-------------+-------+------+---------------+------+---------+-----------+

|  1 | SIMPLE      | C     | ALL  | NULL          | NULL | NULL    | NULL      |

|  1 | SIMPLE      | A     | ref  | a1            | a1   | 5       | test.C.c1 |

+----+-------------+-------+------+---------------+------+---------+-----------+

 

 

连接消除示例1:---对主外键参照的表进行内连接,可以消除主键表 MySQL不支持

第二条SQL:

只有表A和表C进行连接,但WHERE子句多一条判定条件“A.a1 IS NOT NULL”;

 

被查询优化器处理后的语句为:

/* select#1 */ select `test`.`a`.`a1` AS `a1`,  `test`.`a`.`a2` AS `a2`,

    `test`.`c`.`c1` AS `c1`,  `test`.`c`.`c2` AS `c2`

from `test`.`a` join `test`.`c`

where ((`test`.`a`.`a1` = `test`.`c`.`c1`) and (`test`.`c`.`c1` is not null))

 

 

连接消除示例1:---对主外键参照的表进行内连接,可以消除主键表 MySQL不支持

第三条SQL:

只有表A和表C进行连接,但WHERE子句比第二条SQL的WHERE子句内容更为简单

 

mysql> SELECT A.*, C.* FROM A,C WHERE A.a1=C.c1;

+------+------+------+------+

| a1   | a2   | c1   | c2   |

+------+------+------+------+

|    1 | A1   |    1 | C1   |

+------+------+------+------+

1 row in set (0.00 sec)

 

 

连接消除示例1:---对主外键参照的表进行内连接,可以消除主键表

                    MySQL不支持

第三条SQL:

只有表A和表C进行连接,但WHERE子句比第二条SQL的WHERE子句内容更为简单

 

mysql> EXPLAIN EXTENDED SELECT A.*, C.* FROM A,C WHERE A.a1=C.c1;

+----+-------------+-------+------+---------------+------+---------+------+

| id | select_type | table | type | possible_keys | key  | key_len | ref  |

+----+-------------+-------+------+---------------+------+---------+------+

|  1 | SIMPLE      | C     | ALL  | NULL          | NULL | NULL    | NULL |

|  1 | SIMPLE      | A     | ALL  | a1            | NULL | NULL    | NULL |

+----+-------------+-------+------+---------------+------+---------+------+

 

 

连接消除示例1:---对主外键参照的表进行内连接,可以消除主键表 MySQL不支持

第一条SQL:

EXPLAIN EXTENDED SELECT A.*, C.* FROM A,B,C WHERE A.a1=B.b1 AND B.b1=C.c1;

第二条SQL:

EXPLAIN EXTENDED SELECT A.*, C.* FROM A,C WHERE A.a1=C.c1 AND A.a1 IS NOT NULL;

第三条SQL:

EXPLAIN EXTENDED SELECT A.*, C.* FROM A,C WHERE A.a1=C.c1;

 

 

连接消除示例2:---对主外键参照的表进行外连接,可以消除主键表 MySQL不支持

表A外连接表B,然后连接表C,查询目标列没有表B的列,表B没有被消除,查询执行计划如下:

mysql> EXPLAIN EXTENDED SELECT A.*, C.* FROM A LEFT JOIN B ON (a1=b1) JOIN C ON (a1=c1);

+----+-------------+-------+--------+---------------+-----------------------------------------------

| id | select_type | table | type   | possible_keys | Extra     |

+----+-------------+-------+--------+---------------+-----------------------------------------------

|  1 | SIMPLE      | C     | ALL    | NULL          | NULL

|  1 | SIMPLE      | A     | ALL    | a1            | Using where; Using join buffer (Block Nested L

|  1 | SIMPLE      | B     | eq_ref | PRIMARY       | Using index

+----+-------------+-------+--------+---------------+-----------------------------------------------

 

连接消除示例2:---对主外键参照的表进行外连接,可以消除主键表 MySQL不支持

被查询优化器处理后的语句为:

/* select#1 */ select `test`.`a`.`a1` AS `a1`,  `test`.`a`.`a2` AS `a2`,

    `test`.`c`.`c1` AS `c1`,  `test`.`c`.`c2` AS `c2`

from `test`.`a` left join `test`.`b` on((`test`.`b`.`b1` = `test`.`c`.`c1`)) join `test`.`c`

where (`test`.`a`.`a1` = `test`.`c`.`c1`)

 

 

连接消除总结:

注意连接消除与外连接消除的技术差别

连接消除去掉的是被连接的某个对象

外连接消除去掉的是外连接的语义,变形为内连接

 

 

 

 

五,嵌套连接消除:

 

连接存在多个层次,用括号标识连接的优先次序。

嵌套连接消除,就是消除嵌套的连接层次,把多个层次的连接减少为较少层次的连接,尽量“扁平化”

 

 

嵌套连接消除示例:

创建表,命令如下:

CREATE TABLE B (b1 INT, b2 VARCHAR(9));

CREATE TABLE A (a1 INT, a2 VARCHAR(9));

CREATE TABLE C (c1 INT, c2 VARCHAR(9));

插入数据,命令如下:

INSERT INTO B VALUES(1, 'B1'), (NULL, 'B2'), (31, 'B31'), (32, 'B32'), (NULL, 'B4'),(5, 'B5'), (6, 'B6');

INSERT INTO A VALUES(1, 'A1'), (null, 'A2'), (NULL, 'A31'), (32, 'A32'), (4, 'A4'), (5, 'A5'), (NULL, 'A6');

INSERT INTO C VALUES(1, 'C1'), (NULL, 'C2'), (31, 'C31'), (NULL, 'C32'), (4, 'C4'), (NULL, 'C5'),(6, 'A6');

 

 

嵌套连接消除示例1:

SQL语句的语义是B和C先连接,然后再和A连接。查询执行计划如下:

mysql> EXPLAIN EXTENDED SELECT * FROM A JOIN (B JOIN C ON B.b1=C.c1) ON A.a1=B.b1

WHERE A.a1 > 1;

+----+-------------+-------+------------+------+------+----------+--------------------------------------------

| id | select_type | table | partitions | type | rows | filtered | Extra

+----+-------------+-------+------------+------+------+----------+--------------------------------------------

|  1 | SIMPLE      | A     | NULL       | ALL  |    7 |    33.33 | Using where        |

|  1 | SIMPLE      | B     | NULL       | ALL  |    7 |    14.29 | Using where; Using join buffer (Block Nested Loop) |

|  1 | SIMPLE      | C     | NULL       | ALL  |    7 |    14.29 | Using where; Using join buffer (Block Nested Loop) |

+----+-------------+-------+------------+------+------+----------+--------------------------------------------

3 rows in set, 2 warnings (0.02 sec)

 

嵌套连接消除示例1:

被查询优化器处理后的语句为:

/* select#1 */ select `test`.`a`.`a1` AS `a1`,`test`.`a`.`a2` AS `a2`,

  `test`.`b`.`b1` AS `b1`,`test`.`b`.`b2` AS `b2`,`test`.`c`.`c

1` AS `c1`,`test`.`c`.`c2` AS `c2`

from `test`.`a` join `test`.`b` join `test`.`c`

where ((`test`.`b`.`b1` = `test`.`a`.`a1`) and

  (`test`.`c`.`c1` = `test`.`a`.`a1`) and (`test`.`a`.`a1` > 1))

 

 

嵌套连接消除总结:

1 嵌套连接消除的连接的层次,这是一种连接的语义顺序的变化

2 连接消除,消掉的是一些被连接的对象

3 外连接消除,消掉的是外连接的语义,使得外连接变形为内连接

你可能感兴趣的:(Mysql)