什么是多表联合查询
前面所讲的查询语句都是针对一个表的,但是在关系型数据库中,表与表之间是有联系的,所以在实际应用中,经常使用多表查询。多表查询就是同时查询两个或两个以上的表。
在 MySQL 中,多表查询主要有交叉连接、内连接、外连接、分组查询与子查询等5种。
交叉连接(CROSS JOIN)
3.2.1 笛卡尔积
A = {1,2}
B = {3,4,5}
集合 A×B 和 B×A 的结果集分别表示为:
A×B={(1,3), (1,4), (1,5), (2,3), (2,4), (2,5) };
B×A={(3,1), (3,2), (4,1), (4,2), (5,1), (5,2) };
以上 A×B 和 B×A 的结果就叫做两个集合的笛卡尔积。
并且,从以上结果我们可以看出
3.2.2 交叉连接
交叉连接的语法格式如下:
SELECT <字段名> FROM <表1> CROSS JOIN <表2> [WHERE子句];
或
SELECT <字段名> FROM <表1>, <表2> [WHERE子句];
语法说明如下:
注意:多个表交叉连接时,在 FROM 后连续使用 CROSS JOIN
或,
即可。以上两种语法的返回结果是相同的,但是第一种语法才是官方建议的标准写法。
当连接的表之间没有关系时,我们会省略掉 WHERE 子句,这时返回结果就是两个表的笛卡尔积,返回结果数量就是两个表的数据行相乘。需要注意的是,如果每个表有 1000 行,那么返回结果的数量就有 1000×1000 = 1000000 行,数据量是非常巨大的。
交叉连接可以查询两个或两个以上的表,为了更好的理解,我们就讲解两个表的交叉连接查询。
例 1
查询学生信息表和科目信息表,并得到一个笛卡尔积。
为了方便观察学生信息表和科目表交叉连接后的运行结果,我们先分别查询出这两个表的数据,再进行交叉连接查询。
1)查询 tb_students_info 表中的数据,SQL 语句和运行结果如下:
mysql>create database firm;
mysql>use firm;
mysql>create table staff_info(id int not null primary key auto_increment,name varchar(30),age tinyint,sex varcha(6),interst_id int);
mysql>insert staff_info(name,age,sex,interest_id) values('tom',22,'male',1),('mary',25,'female',4),('ang',23,'male',2),('fred',26,'male',1),('yum',24,'male',3),('dad',39,'male',3),('alice',25,'female',2),('hod',24,'male',2),('slla',22,'female',1);
mysql> SELECT * FROM staff_info;
+----+-------+------+--------+-------------+
| id | name | age | sex | interest_id |
+----+-------+------+--------+-------------+
| 1 | tom | 22 | male | 1 |
| 2 | mary | 25 | female | 4 |
| 3 | ang | 23 | male | 2 |
| 4 | fred | 26 | male | 1 |
| 5 | yum | 24 | male | 3 |
| 6 | dad | 39 | male | 3 |
| 7 | alice | 25 | female | 2 |
| 8 | hod | 24 | male | 2 |
| 9 | slla | 22 | female | 1 |
+----+-------+------+--------+-------------+
9 rows in set (0.00 sec)
2)查询 interest 表中的数据,SQL 语句和运行结果如下:
mysql>create table interest(id int not null primary key auto_increment,interest_name varchar(10));
mysql> insert interest(interest_name) values('sleep'),('pubg'),('surf'),('ski'),('swim');
mysql> SELECT * FROM interest;
+----+---------------+
| id | interest_name |
+----+---------------+
| 1 | sleep |
| 2 | pubg |
| 3 | surf |
| 4 | ski |
| 5 | swim |
+----+---------------+
5 rows in set (0.00 sec)
3)使用 CROSS JOIN 查询出两张表中的笛卡尔积,SQL 语句和运行结果如下:
+----+-------+------+--------+-------------+----+---------------+
| id | name | age | sex | interest_id | id | interest_name |
+----+-------+------+--------+-------------+----+---------------+
| 1 | tom | 22 | male | 1 | 1 | sleep |
| 1 | tom | 22 | male | 1 | 2 | pubg |
| 1 | tom | 22 | male | 1 | 3 | surf |
| 1 | tom | 22 | male | 1 | 4 | ski |
| 1 | tom | 22 | male | 1 | 5 | swim |
| 2 | mary | 25 | female | 4 | 1 | sleep |
| 2 | mary | 25 | female | 4 | 2 | pubg |
| 2 | mary | 25 | female | 4 | 3 | surf |
| 2 | mary | 25 | female | 4 | 4 | ski |
| 2 | mary | 25 | female | 4 | 5 | swim |
| 3 | ang | 23 | male | 2 | 1 | sleep |
| 3 | ang | 23 | male | 2 | 2 | pubg |
| 3 | ang | 23 | male | 2 | 3 | surf |
| 3 | ang | 23 | male | 2 | 4 | ski |
| 3 | ang | 23 | male | 2 | 5 | swim |
| 4 | fred | 26 | male | 1 | 1 | sleep |
| 4 | fred | 26 | male | 1 | 2 | pubg |
| 4 | fred | 26 | male | 1 | 3 | surf |
| 4 | fred | 26 | male | 1 | 4 | ski |
| 4 | fred | 26 | male | 1 | 5 | swim |
| 5 | yum | 24 | male | 3 | 1 | sleep |
| 5 | yum | 24 | male | 3 | 2 | pubg |
| 5 | yum | 24 | male | 3 | 3 | surf |
| 5 | yum | 24 | male | 3 | 4 | ski |
| 5 | yum | 24 | male | 3 | 5 | swim |
| 6 | dad | 39 | male | 3 | 1 | sleep |
| 6 | dad | 39 | male | 3 | 2 | pubg |
| 6 | dad | 39 | male | 3 | 3 | surf |
| 6 | dad | 39 | male | 3 | 4 | ski |
| 6 | dad | 39 | male | 3 | 5 | swim |
| 7 | alice | 25 | female | 2 | 1 | sleep |
| 7 | alice | 25 | female | 2 | 2 | pubg |
| 7 | alice | 25 | female | 2 | 3 | surf |
| 7 | alice | 25 | female | 2 | 4 | ski |
| 7 | alice | 25 | female | 2 | 5 | swim |
| 8 | hod | 24 | male | 2 | 1 | sleep |
| 8 | hod | 24 | male | 2 | 2 | pubg |
| 8 | hod | 24 | male | 2 | 3 | surf |
| 8 | hod | 24 | male | 2 | 4 | ski |
| 8 | hod | 24 | male | 2 | 5 | swim |
| 9 | slla | 22 | female | 1 | 1 | sleep |
| 9 | slla | 22 | female | 1 | 2 | pubg |
| 9 | slla | 22 | female | 1 | 3 | surf |
| 9 | slla | 22 | female | 1 | 4 | ski |
| 9 | slla | 22 | female | 1 | 5 | swim |
+----+-------+------+--------+-------------+----+---------------+
45 rows in set (0.00 sec)
由运行结果可以看出,两张表交叉连接查询后,返回了 45条记录。可以想象,当表中的数据较多时,得到的运行结果会非常长,而且得到的运行结果也没太大的意义。所以,通过交叉连接的方式进行多表查询的这种方法并不常用,我们应该尽量避免这种查询。
例2
查询 interset 表中的 id 字段和 staff_info 表中的 interset_name字段相等的内容, SQL 语句和运行结果如下:
mysql> select * from staff_info join interest where interest.id=staff_info.interesst_id;
+----+-------+------+--------+-------------+----+---------------+
| id | name | age | sex | interest_id | id | interest_name |
+----+-------+------+--------+-------------+----+---------------+
| 1 | tom | 22 | male | 1 | 1 | sleep |
| 2 | mary | 25 | female | 4 | 4 | ski |
| 3 | ang | 23 | male | 2 | 2 | pubg |
| 4 | fred | 26 | male | 1 | 1 | sleep |
| 5 | yum | 24 | male | 3 | 3 | surf |
| 6 | dad | 39 | male | 3 | 3 | surf |
| 7 | alice | 25 | female | 2 | 2 | pubg |
| 8 | hod | 24 | male | 2 | 2 | pubg |
| 9 | slla | 22 | female | 1 | 1 | sleep |
+----+-------+------+--------+-------------+----+---------------+
9 rows in set (0.00 sec)
如果在交叉连接时使用 WHERE 子句,MySQL 会先生成两个表的笛卡尔积,然后再选择满足 WHERE 条件的记录。因此,表的数量较多时,交叉连接会非常非常慢。一般情况下不建议使用交叉连接。
在 MySQL 中,多表查询一般使用内连接和外连接,它们的效率要高于交叉连接。
3.3 (常用)内连接 (INNER JOIN ON)
内连接(INNER JOIN)主要通过设置连接条件的方式,来移除查询结果中某些数据行的交叉连接。简单来说,就是利用条件表达式来消除交叉连接的某些数据行。
内连接使用 INNER JOIN 关键字连接两张表,并使用 ON 子句来设置连接条件。如果没有连接条件,INNER JOIN 和 CROSS JOIN 在语法上是等同的,两者可以互换。
内连接的语法格式如下:
SELECT <字段名> FROM <表1> INNER JOIN <表2> [ON子句];
语法说明如下:
在 staff_info 表和 interset 表之间,①使用内连接查询员工姓名和相对应的兴趣,或者②使用内连接查询员工姓名年龄和相对应的兴趣,SQL 语句和运行结果如下。
#可以定义命令行表的别名(先用后再from 后面定义 )
mysql> select a.name,b.interest_name from staff_info a inner join interest b on a.interest_id=b.id;
+-------+---------------+
| name | interest_name |
+-------+---------------+
| tom | sleep |
| mary | ski |
| ang | pubg |
| fred | sleep |
| yum | surf |
| dad | surf |
| alice | pubg |
| hod | pubg |
| slla | sleep |
+-------+---------------+
9 rows in set (0.00 sec)
# select可以查看多个指标
mysql> select a.age,a.name,b.interest_name interest from staff_info a inner join inteerest b on a.interest_id=b.id;
+------+-------+----------+
| age | name | interest |
+------+-------+----------+
| 22 | tom | sleep |
| 25 | mary | ski |
| 23 | ang | pubg |
| 26 | fred | sleep |
| 24 | yum | surf |
| 39 | dad | surf |
| 25 | alice | pubg |
| 24 | hod | pubg |
| 22 | slla | sleep |
+------+-------+----------+
9 rows in set (0.00 sec)
#还可以定义执行结果后 表头的别名
mysql> select a.name who,b.interest_name interest from staff_info a inner join intereest b on a.interest_id=b.id;
+-------+----------+
| who | interest |
+-------+----------+
| tom | sleep |
| mary | ski |
| ang | pubg |
| fred | sleep |
| yum | surf |
| dad | surf |
| alice | pubg |
| hod | pubg |
| slla | sleep |
+-------+----------+
9 rows in set (0.00 sec)
在 staff_info 表和 interset 表中,我们分别把staff表和interest表作为基表,使用左连接查询员工姓名年龄和相对应的兴趣,查看SQL 语句和运行结果如下:
#以左边staff_info 的表为主表/基表 右边为辅表
mysql> select a.name who,b.interest_name interest from staff_info a left join interest b on a.interest_id=b.id;
+---------+----------+
| who | interest |
+---------+----------+
| tom | sleep |
| mary | ski |
| ang | pubg |
| fred | sleep |
| yum | surf |
| dad | surf |
| alice | pubg |
| hod | pubg |
| slla | sleep |
| xixi | NULL |
+---------+----------+
10 rows in set (0.00 sec)
#以左边interest 的表为主表/基表 右边为辅表
mysql> select b.interest_name interest,a.name who from interest b left join staff_info a on b.id=a.interest_id;
+----------+-------+
| interest | who |
+----------+-------+
| sleep | tom |
| ski | mary |
| pubg | ang |
| sleep | fred |
| surf | yum |
| surf | dad |
| pubg | alice |
| pubg | hod |
| sleep | slla |
| swim | NULL |
| yummy | NULL |
+----------+-------+
11 rows in set (0.00 sec)
SELECT <字段名> FROM <表1> RIGHT OUTER JOIN <表2> <ON子句>;
语法说明如下:
因为上述已经演示过,我们这里演示把interest放在右边作为基表(staff_info作为辅表),进行右连接查询。
#右边以interest 的表为主表/基表 左边为辅表时
mysql> select b.interest_name interest,a.age old from staff_info a right join interest b on a.interest_id=b.id;
+----------+------+
| interest | old |
+----------+------+
| sleep | 22 |
| ski | 25 |
| pubg | 23 |
| sleep | 26 |
| surf | 24 |
| surf | 39 |
| pubg | 25 |
| pubg | 24 |
| sleep | 22 |
| swim | NULL |
| yummy | NULL |
+----------+------+
11 rows in set (0.00 sec)
右边以interest 的表为主表/基表 左边为辅表时, 结果显示了 11条记录
右表的各项值优先去对应,没有则为空(swim yummy)。
多个表左/右连接时,在 ON 子句后连续使用 LEFT/RIGHT OUTER JOIN 或 LEFT/RIGHT JOIN 即可。
使用外连接查询时,一定要分清需要查询的结果,是需要显示左表的全部记录还是右表的全部记录,然后选择相应的左连接和右连接。
3.5 分组查询
在 MySQL 中,GROUP BY 关键字可以根据一个或多个字段对查询结果进行分组。
使用 GROUP BY 关键字的语法格式如下:
GROUP BY <字段名>
其中,"字段名"表示需要分组的字段名称,多个字段时用逗号隔开。
3.5.1 (不推荐)GROUP BY单独使用
单独使用 GROUP BY 关键字时,查询结果会只显示每个分组的第一条记录。
下面根据 staff_info 表中的 sex 字段进行分组查询,SQL 语句和运行结果如下:
mysql> select 'name','sex' from staff_info group by sex;
+------+-----+
| name | sex |
+------+-----+
| name | sex |
| name | sex |
+------+-----+
2 rows in set, 1 warning (0.00 sec)
结果中只显示了两条记录,这两条记录的 sex 字段的值分别为“女”和“男”。
3.5.2 GROUP BY 与 GROUP_CONCAT()
GROUP BY 关键字可以和 GROUP_CONCAT() 函数一起使用。
GROUP_CONCAT() 函数会把每个分组的字段值都显示出来。
单一字段分组查询
下面根据 staff_info 表中的 sex 字段进行分组查询,使用 GROUP_CONCAT() 函数将每个分组的 age字段的值(别名为old)都显示出来。SQL 语句和运行结果如下:
mysql> select sex,group_concat(age) old from staff_info group by sex;
+--------+----------------------+
| sex | old |
+--------+----------------------+
| female | 25,25,22 |
| male | 22,23,26,24,39,24,26 |
+--------+----------------------+
2 rows in set (0.00 sec)
由结果可以看到,查询结果分为两组,sex 字段值为"male"的是一组,值为"female"的是一组,且每组的old都显示出来了。
多个字段分组查询
下面根据 staff_info 表中的 interest_id 和 sex 字段进行分组查询。SQL 语句和运行结果如下:
mysql> select sex,interest_id,group_concat(name) who from staff_info group by sex,inteerest_id;
+--------+-------------+----------+
| sex | interest_id | who |
+--------+-------------+----------+
| female | 1 | slla |
| female | 2 | alice |
| female | 4 | mary |
| male | NULL | xiaoxie |
| male | 1 | tom,fred |
| male | 2 | ang,hod |
| male | 3 | yum,dad |
+--------+-------------+----------+
7 rows in set (0.00 sec)
上面实例在分组过程中,先按照 sex 字段进行分组,当 age 字段值相等时,再把 age 字段值相等的记录按照 interest_id 字段进行分组。
多个字段分组查询时,会先按照第一个字段进行分组。如果第一个字段中有相同的值,MySQL 才会按照第二个字段进行分组。如果第一个字段中的数据都是唯一的,那么 MySQL 将不再对第二个字段进行分组
3.5.3 GROUP BY 与聚合函数
在数据统计时,GROUP BY 关键字经常和聚合函数一起使用。
**聚合函数包括 COUNT(),SUM(),AVG(),MAX() 和 MIN()。**其中,COUNT() 用来统计记录的条数;SUM() 用来计算字段值的总和;AVG() 用来计算字段值的平均值;MAX() 用来查询字段的最大值;MIN() 用来查询字段的最小值。
下面根据 staff_info 表的 age 字段进行分组查询,使用 COUNT(),SUM(),AVG(),MAX() 和 MIN()函数计算每一组的记录数。SQL 语句和运行结果如下
#count统计每个年龄的记录条数
mysql> select age,count(age) from staff_info group by age;
+------+------------+
| age | count(age) |
+------+------------+
| 22 | 2 |
| 23 | 1 |
| 24 | 2 |
| 25 | 2 |
| 26 | 2 |
| 39 | 1 |
+------+------------+
6 rows in set (0.00 sec)
#sum 计算 不同性别的年龄总和
mysql> select sex,sum(age) from staff_info group by sex;
+--------+----------+
| sex | sum(age) |
+--------+----------+
| female | 72 |
| male | 184 |
+--------+----------+
2 rows in set (0.00 sec)
#avg 计算 不同性别的年龄均值
mysql> select sex,avg(age) from staff_info group by sex;
+--------+----------+
| sex | avg(age) |
+--------+----------+
| female | 24.0000 |
| male | 26.2857 |
+--------+----------+
2 rows in set (0.00 sec)
# max 不同性别的年龄最大值
mysql> select sex,max(age) from staff_info group by sex;
+--------+----------+
| sex | max(age) |
+--------+----------+
| female | 25 |
| male | 39 |
+--------+----------+
2 rows in set (0.00 sec)
# min 不同性别的年龄最小值
mysql> select sex,min(age) from staff_info group by sex;
+--------+----------+
| sex | min(age) |
+--------+----------+
| female | 22 |
| male | 22 |
+--------+----------+
2 rows in set (0.00 sec)
3.5.4 GROUP BY 与 WITH ROLLUP
WITH ROLLUP 关键字用来在所有记录的最后加上一条记录,这条记录是上面所有记录的总和,即统计记录数量。
下面根据 staff_info 表中的 sex 和interest_id字段进行分组查询,并使用 WITH ROLLUP 显示记录的总和:
mysql> select sex,group_concat(age) old from staff_info group by sex with rollup;
+--------+-------------------------------+
| sex | old |
+--------+-------------------------------+
| female | 25,25,22 |
| male | 22,23,26,24,39,24,26 |
| NULL | 25,25,22,22,23,26,24,39,24,26 |
+--------+-------------------------------+
3 rows in set (0.00 sec)
mysql> select interest_id,group_concat(name) old from staff_info group by interest_id with rollup;
+-------------+--------------------------------------------------+
| interest_id | old |
+-------------+--------------------------------------------------+
| NULL | xixi |
| 1 | tom,fred,slla |
| 2 | ang,alice,hod |
| 3 | yum,dad |
| 4 | mary |
| NULL | xixi,tom,fred,slla,ang,alice,hod,yum,dad,mary |
+-------------+--------------------------------------------------+
6 rows in set (0.00 sec)
3.6 子查询
子查询是 MySQL 中比较常用的查询方法,通过子查询可以实现多表查询。
子查询可以将一个查询语句嵌套在另一个查询语句中,而且可以进行多层嵌套。子查询可以在 SELECT、UPDATE 和 DELETE 语句中使用,。
在实际开发时,子查询经常出现在 WHERE 子句中。
子查询在 WHERE 中的语法格式如下:
WHERE <表达式> <操作符> (子查询)
其中,操作符可以是比较运算符和 IN、NOT IN、EXISTS、NOT EXISTS 等关键字。
1)IN | NOT IN
当表达式与子查询返回的结果集中的某个值相等时,返回 TRUE,否则返回 FALSE;若使用关键字 NOT,则返回值正好相反。
例 1 in
使用子查询staff_info表中 interest_id值对应于(interest表中 interest_name 为’sleep’的id值)的员工姓名SQL 语句和运行结果如下:
mysql> select name from staff_info where interest_id in (select id from interest wherre interest_name = 'sleep');
+------+
| name |
+------+
| tom |
| fred |
| slla |
+------+
3 rows in set (0.00 sec)
与以下拆分的这种查询方式所得到的结果是一样的
首先单独执行内查询,查询出 interset 表中兴趣为 sleep 的 id值,SQL 语句和运行结果如下:
与以下拆分的这种查询方式所得到的结果是一样的
首先单独执行内查询,查询出 interset 表中兴趣为 sleep 的 id值,SQL 语句和运行结果如下:
mysql> select id from interest where interest_name = 'sleep';
+----+
| id |
+----+
| 1 |
+----+
1 row in set (0.00 sec)
可以看到,符合条件的 id 字段的值为 1。
然后执行外层查询,在 tb_students_info 表中查询 course_id 等于 1 的学生姓名。SQL 语句和运行结果如下:
mysql> select name from staff_info where interest_id=1;
+------+
| name |
+------+
| tom |
| fred |
| slla |
+------+
3 rows in set (0.00 sec)
习惯上,外层的 SELECT 查询称为父查询,圆括号中嵌入的查询称为子查询(子查询必须放在圆括号内)。MySQL 在处理上例的 SELECT 语句时,执行流程为:先执行子查询,再执行父查询。
例 2 not in
与例 1 类似,在 SELECT 语句中使用 NOT IN 关键字,查询interset_id不等于 1 的员工姓名,SQL 语句和运行结果如下:
mysql> select name from staff_info where interest_id not in (select id from interestt where interest_name = 'sleep');
+-------+
| name |
+-------+
| mary |
| ang |
| yum |
| dad |
| alice |
| hod |
+-------+
6 rows in set (0.00 sec)
可以看出,运行结果与上面的例子刚好相反,结果为interest_id不是sleep的员工姓名。
例 3 = 与 in
使用=运算符,在 interset 表和 staff_info 表中查询出interest_id是sleep的员工姓名,SQL 语句和运行结果如下:
mysql> select name from staff_info where interest_id=(select id from interest whereinterest_name = 'sleep');
+------+
| name |
+------+
| tom |
| fred |
| slla |
+------+
3 rows in set (0.00 sec)