联合查询又称为多表查询,它的基本执行过程就是笛卡尔积
那么什么是笛卡尔积呢?
答:笛卡尔积就是将两张表放在一起进行计算,把第一张表的每一行分别取出来和第二张表的每一行进行连接,得到一个新的行。
举例说明笛卡尔积:
假设我们现在有两张表分别为学生信息表和班级信息表
现在我们把这两张表进行笛卡尔积操作:
笛卡尔积相当于乘法运算,列数是两个表列数之和,行数是两个表行数之积
注:笛卡尔积执行后产生的结果大多是无效的,此时我们就可以采用条件进行筛选
接下来我们就来试一下如何进行笛卡尔积操作:
首先创建两张表,分别为上述的学生信息表和班级信息表,创建完两张表后并给它们添加上述表中的内容
select * from student;
+----+------+---------+
| id | name | classid |
+----+------+---------+
| 1 | 张三 | 1 |
| 2 | 李四 | 2 |
| 3 | 王五 | 1 |
+----+------+---------+
select * from class;
+---------+-----------+
| classid | classname |
+---------+-----------+
| 1 | 舞蹈班 |
| 2 | 跆拳道班 |
+---------+-----------+
然后对这两张表进行笛卡尔积操作
select * from student,class;
+----+------+---------+---------+-----------+
| id | name | classid | classid | classname |
+----+------+---------+---------+-----------+
| 1 | 张三 | 1 | 1 | 舞蹈班 |
| 1 | 张三 | 1 | 2 | 跆拳道班 |
| 2 | 李四 | 2 | 1 | 舞蹈班 |
| 2 | 李四 | 2 | 2 | 跆拳道班 |
| 3 | 王五 | 1 | 1 | 舞蹈班 |
| 3 | 王五 | 1 | 2 | 跆拳道班 |
+----+------+---------+---------+-----------+
上述的笛卡尔积执行后产生的结果大多数是无效的,此时我们就可以采用条件进行筛选
当 student 表中的 classid 和 class 表中的 classid 相等时,则这条数据是有效的数据
select * from student,class where classid = classid;
ERROR 1052 (23000): Column 'classid' in where clause is ambiguous
如果直接用 classid = classid 则会报错,因为它无法分辨哪个classid 和 哪个 classid 进行比较
select * from student,class where student.classid = class.classid;
+----+------+---------+---------+-----------+
| id | name | classid | classid | classname |
+----+------+---------+---------+-----------+
| 1 | 张三 | 1 | 1 | 舞蹈班 |
| 2 | 李四 | 2 | 2 | 跆拳道班 |
| 3 | 王五 | 1 | 1 | 舞蹈班 |
+----+------+---------+---------+-----------+
那么此时就可以采用 表名.列名 的方式进行区分
注:多表查询除了可以加上连接条件外,还可以加上其他条件
多表查询出来用 from 多个表加逗号分隔 来连接多个表外,还可以用 join on 来连接,还可以是 inner join on
join on 实现多表查询:
select * from student join class on student.classid = class.classid;
+----+------+---------+---------+-----------+
| id | name | classid | classid | classname |
+----+------+---------+---------+-----------+
| 1 | 张三 | 1 | 1 | 舞蹈班 |
| 2 | 李四 | 2 | 2 | 跆拳道班 |
| 3 | 王五 | 1 | 1 | 舞蹈班 |
+----+------+---------+---------+-----------+
join 连接的是两个表,on 后面跟的是连接条件
inner join on 实现多表查询:
select * from student inner join class on student.classid = class.classid;
+----+------+---------+---------+-----------+
| id | name | classid | classid | classname |
+----+------+---------+---------+-----------+
| 1 | 张三 | 1 | 1 | 舞蹈班 |
| 2 | 李四 | 2 | 2 | 跆拳道班 |
| 3 | 王五 | 1 | 1 | 舞蹈班 |
+----+------+---------+---------+-----------+
inner join on 其实跟 join on 一样,此处不做过多解释
from 多个表 和 join on 的主要区别:
from 多个表只能实现内连接
join on 既可以实现内连接也可以实现外连接
内连接 和 外连接的主要区别:
当连接的两个表里面的数据是一一对应的时候,内连接和外连接其实就没啥区别
当连接的两个表里面的数据不是一一对应的时候,内连接和外连接就有区别了
现在有两张表,分别为 student 学生表 和 score 成绩表:
select * from student;
+----+------+
| id | name |
+----+------+
| 1 | 张三 |
| 2 | 李四 |
| 3 | 王五 |
+----+------+
select * from scoretable;
+-----------+-------+
| studentId | score |
+-----------+-------+
| 1 | 97 |
| 2 | 86 |
| 3 | 73 |
+-----------+-------+
id 和 studentId 是一一对应的,所有内连接和外连接没什么区别
内连接:
select * from student,scoreTable where student.id = scoretable.studentId;
+----+------+-----------+-------+
| id | name | studentId | score |
+----+------+-----------+-------+
| 1 | 张三 | 1 | 97 |
| 2 | 李四 | 2 | 86 |
| 3 | 王五 | 3 | 73 |
+----+------+-----------+-------+
外连接:
select * from student join scoreTable on student.id = scoretable.studentId;
+----+------+-----------+-------+
| id | name | studentId | score |
+----+------+-----------+-------+
| 1 | 张三 | 1 | 97 |
| 2 | 李四 | 2 | 86 |
| 3 | 王五 | 3 | 73 |
+----+------+-----------+-------+
现在有两张表,分别为 student 学生表 和 score 成绩表:
select * from student;
+----+------+
| id | name |
+----+------+
| 1 | 张三 |
| 2 | 李四 |
| 3 | 王五 |
+----+------+
select * from scoretable;
+-----------+-------+
| studentId | score |
+-----------+-------+
| 1 | 97 |
| 2 | 86 |
| 6 | 73 |
+-----------+-------+
现在我们可以看到 student 中的 id 为 3 的在 scoretable 中没有对应的 studentId
内连接:
select * from student,scoreTable where student.id = scoretable.studentId;
+----+------+-----------+-------+
| id | name | studentId | score |
+----+------+-----------+-------+
| 1 | 张三 | 1 | 97 |
| 2 | 李四 | 2 | 86 |
+----+------+-----------+-------+
当进行内连接的时候因为student中的id为3 的和scoretable中的studentId为6的不匹配所以就被筛除了没有查询出来
外连接:
当两张表不是一一对应的时候,外连接又可以分为 左外连接 和 右外连接
左外连接:left join on
select * from student left join scoreTable on student.id = scoretable.studentId;
+----+------+-----------+-------+
| id | name | studentId | score |
+----+------+-----------+-------+
| 1 | 张三 | 1 | 97 |
| 2 | 李四 | 2 | 86 |
| 3 | 王五 | NULL | NULL |
+----+------+-----------+-------+
左外连接会把左表的结果尽量显示出来,如果右表中没有对应的记录,就使用NULL填充
右外连接:right join on
select * from student right join scoreTable on student.id = scoretable.studentId;
+------+------+-----------+-------+
| id | name | studentId | score |
+------+------+-----------+-------+
| 1 | 张三 | 1 | 97 |
| 2 | 李四 | 2 | 86 |
| NULL | NULL | 6 | 73 |
+------+------+-----------+-------+
右外连接会把右表的结果尽量显示出来,如果左表中没有对应的记录,就使用NULL填充
自连接:自己和自己进行笛卡尔积
自连接使用场景:当行与行进行比较时,就可以使用自连接,将行转成列进行比较
现在有两张表,分别为 scoretable 和 course
scoretable 表:
select * from scoretable;
+-------+------------+-----------+
| score | student_id | course_id |
+-------+------------+-----------+
| 70 | 1 | 1 |
| 96 | 1 | 2 |
| 97 | 1 | 3 |
| 80 | 2 | 1 |
| 92 | 2 | 2 |
| 86 | 2 | 3 |
| 91 | 3 | 1 |
| 76 | 3 | 2 |
| 77 | 3 | 3 |
+-------+------------+-----------+
course 表:
select * from course;
+----+------+
| id | name |
+----+------+
| 1 | 语文 |
| 2 | 数学 |
| 3 | 英语 |
+----+------+
现在我们要查询哪些同学的语文成绩比英语成绩低
首先自连接,将行转换成列:
select * from scoretable,scoretable;
ERROR 1066 (42000): Not unique table/alias: 'scoretable'
自己跟自己连接名字不能重复
那表名不能重复,那还如何自连接呢?
答:可以起别名,起别名不光可以对列,还可以对表
select * from scoretable as s1,scoretable as s2;
自连接排列组合的时候会产生大量无效的数据,所有就需要指定连接条件
指定连接条件,将有效数据筛选出来:
select * from scoretable as s1,scoretable as s2
where s1.student_id = s2.student_id;
自连接的时候只有当 student_id 相等时才表示有效数据
添加条件,将左边表的语文成绩和右边表的英语成绩查询出来:
有效成绩查询出来后,就需要加上条件查询出左边的语文成绩和右边的英语成绩
select * from scoretable as s1,scoretable as s2
where s1.student_id = s2.student_id
and s1.course_id = 1 and s2.course_id = 3;
+-------+------------+-----------+-------+------------+-----------+
| score | student_id | course_id | score | student_id | course_id |
+-------+------------+-----------+-------+------------+-----------+
| 70 | 1 | 1 | 97 | 1 | 3 |
| 80 | 2 | 1 | 86 | 2 | 3 |
| 91 | 3 | 1 | 77 | 3 | 3 |
+-------+------------+-----------+-------+------------+-----------+
这样就将左侧的语文成绩查询出来了,右侧的英语成绩查询出来了
添加条件,将语文成绩比英语成绩低的同学查询出来:
接下来就要查询哪些同学的语文成绩比英语成绩低
select * from scoretable as s1,scoretable as s2
where s1.student_id = s2.student_id
and s1.course_id = 1 and s2.course_id = 3 and s1.score < s2.score;
+-------+------------+-----------+-------+------------+-----------+
| score | student_id | course_id | score | student_id | course_id |
+-------+------------+-----------+-------+------------+-----------+
| 70 | 1 | 1 | 97 | 1 | 3 |
| 80 | 2 | 1 | 86 | 2 | 3 |
+-------+------------+-----------+-------+------------+-----------+
2 rows in set (0.00 sec)
这样就把语文成绩比英语成绩低的学生信息查询出来了
子查询:把多个 SQL 组合成一个
在实际开发中,子查询得慎用。因为子查询可能会构造出非常复杂,非常不好理解的 SQL。
写代码一般要么追求可读性和可维护性,要么追求程序的运行速度
单行子查询:返回一行记录的子查询
student 表:
select * from student;
+----+----------+------+
| id | class_id | name |
+----+----------+------+
| 1 | 1 | 张三 |
| 2 | 1 | 李四 |
| 3 | 2 | 王五 |
| 4 | 3 | 赵六 |
| 5 | 2 | 王七 |
+----+----------+------+
现在查询“张三”的同班同学,根据 class_id 进行查询
分开查询:
//查询出张三的class_id
select class_id from student where name = '张三';
+----------+
| class_id |
+----------+
| 1 |
+----------+
//查询出来的张三的class_id为 1,再查询除了张三以外的class_id 为1的同学
select * from student where class_id = 1 and name != '张三';
+----+----------+------+
| id | class_id | name |
+----+----------+------+
| 2 | 1 | 李四 |
+----+----------+------+
单行子查询:
select * from student where
class_id = ( select class_id from student where name = '张三')
and name != '张三';
+----+----------+------+
| id | class_id | name |
+----+----------+------+
| 2 | 1 | 李四 |
+----+----------+------+
多行子查询:返回多行记录的子查询
scoretable 表:
select * from scoretable;
+-------+------------+-----------+
| score | student_id | course_id |
+-------+------------+-----------+
| 70 | 1 | 1 |
| 96 | 1 | 2 |
| 97 | 1 | 3 |
| 80 | 2 | 1 |
| 92 | 2 | 2 |
| 86 | 2 | 3 |
| 91 | 3 | 1 |
| 76 | 3 | 2 |
| 77 | 3 | 3 |
+-------+------------+-----------+
course 表:
select * from course;
+----+------+
| id | name |
+----+------+
| 1 | 语文 |
| 2 | 数学 |
| 3 | 英语 |
+----+------+
查询每位同学的“语文”“英语”课程的成绩信息
普通查询:
//首先查询出语文和英语成绩对应的id
select id from course where name = '语文' or name = '英语';
+----+
| id |
+----+
| 1 |
| 3 |
+----+
//再根据查询出来的语文英语对应的id,在 scoretable表中查询
select * from scoretable where course_id = 1 or course_id = 3;
+-------+------------+-----------+
| score | student_id | course_id |
+-------+------------+-----------+
| 70 | 1 | 1 |
| 97 | 1 | 3 |
| 80 | 2 | 1 |
| 86 | 2 | 3 |
| 91 | 3 | 1 |
| 77 | 3 | 3 |
+-------+------------+-----------+
多行子查询:
select * from scoretable where course_id
in(select id from course where name = '语文' or name = '英语');
+-------+------------+-----------+
| score | student_id | course_id |
+-------+------------+-----------+
| 70 | 1 | 1 |
| 97 | 1 | 3 |
| 80 | 2 | 1 |
| 86 | 2 | 3 |
| 91 | 3 | 1 |
| 77 | 3 | 3 |
+-------+------------+-----------+
合并查询:就是将两个查询结果集,合并成一个
在实际应用中,为了合并多个查询的执行结果,可以使用集合操作符 union,union all。使用UNION 和UNION ALL时,前后查询的结果集中,字段需要一致
union操作符
union操作符用于取得两个结果集的并集,当使用该操作符时,会自动去掉结果集中的重复行
course 表:
select * from course;
+----+------+
| id | name |
+----+------+
| 1 | 语文 |
| 2 | 数学 |
| 3 | 英语 |
| 6 | 化学 |
| 7 | 物理 |
+----+------+
现在查询 id 小于等于 2 或者 name 为 "英文" 的课程信息
select * from course where id <= 2 union select * from course where name = '英语';
+----+------+
| id | name |
+----+------+
| 1 | 语文 |
| 2 | 数学 |
| 3 | 英语 |
+----+------+
看到这里大家可能有个疑问,明明可以用 or 也能实现,为什么还要用 union?
答:用 or 查询只能时来自于同一个表,如果用 union 查询可以时来自于不同的表,子要查询的结果列匹配即可,匹配就是列的类型一样、列的一样、列的名字一样
union all 操作符
union all 操作符用于取得两个结果集的并集,当使用该操作符时,不会去掉结果集中的重复行
select * from course where id < 3 union all select * from course where name = '数学';
+----+------+
| id | name |
+----+------+
| 1 | 语文 |
| 2 | 数学 |
| 2 | 数学 |
+----+------+