在讲解多表查询前,我们先回顾一下单表查询,这是因为多表查询本质上依然是单表查询(其原因在下文中讲解多表查询时再说明),只要掌握了单表查询,那么想掌握多表查询是非常简单的。
在<
DROP database IF EXISTS `scott`;
CREATE database IF NOT EXISTS `scott` DEFAULT CHARACTER SET utf8 COLLATE utf8_general_ci;
USE `scott`;
DROP TABLE IF EXISTS `dept`;
CREATE TABLE `dept` (
`deptno` int(2) unsigned zerofill NOT NULL COMMENT '部门编号',
`dname` varchar(14) DEFAULT NULL COMMENT '部门名称',
`loc` varchar(13) DEFAULT NULL COMMENT '部门所在地点'
);
DROP TABLE IF EXISTS `emp`;
CREATE TABLE `emp` (
`empno` int(6) unsigned zerofill NOT NULL COMMENT '雇员编号',
`ename` varchar(10) DEFAULT NULL COMMENT '雇员姓名',
`job` varchar(9) DEFAULT NULL COMMENT '雇员职位',
`mgr` int(4) unsigned zerofill DEFAULT NULL COMMENT '雇员领导编号',
`hiredate` datetime DEFAULT NULL COMMENT '雇佣时间',
`sal` decimal(7,2) DEFAULT NULL COMMENT '工资月薪',
`comm` decimal(7,2) DEFAULT NULL COMMENT '奖金',
`deptno` int(2) unsigned zerofill DEFAULT NULL COMMENT '部门编号'
);
DROP TABLE IF EXISTS `salgrade`;
CREATE TABLE `salgrade` (
`grade` int(11) DEFAULT NULL COMMENT '等级',
`losal` int(11) DEFAULT NULL COMMENT '此等级最低工资',
`hisal` int(11) DEFAULT NULL COMMENT '此等级最高工资'
);
insert into dept (deptno, dname, loc)
values (10, 'ACCOUNTING', 'NEW YORK');
insert into dept (deptno, dname, loc)
values (20, 'RESEARCH', 'DALLAS');
insert into dept (deptno, dname, loc)
values (30, 'SALES', 'CHICAGO');
insert into dept (deptno, dname, loc)
values (40, 'OPERATIONS', 'BOSTON');
insert into emp (empno, ename, job, mgr, hiredate, sal, comm, deptno)
values (7369, 'SMITH', 'CLERK', 7902, '1980-12-17', 800, null, 20);
insert into emp (empno, ename, job, mgr, hiredate, sal, comm, deptno)
values (7499, 'ALLEN', 'SALESMAN', 7698, '1981-02-20', 1600, 300, 30);
insert into emp (empno, ename, job, mgr, hiredate, sal, comm, deptno)
values (7521, 'WARD', 'SALESMAN', 7698, '1981-02-22', 1250, 500, 30);
insert into emp (empno, ename, job, mgr, hiredate, sal, comm, deptno)
values (7566, 'JONES', 'MANAGER', 7839, '1981-04-02', 2975, null, 20);
insert into emp (empno, ename, job, mgr, hiredate, sal, comm, deptno)
values (7654, 'MARTIN', 'SALESMAN', 7698, '1981-09-28', 1250, 1400, 30);
insert into emp (empno, ename, job, mgr, hiredate, sal, comm, deptno)
values (7698, 'BLAKE', 'MANAGER', 7839, '1981-05-01', 2850, null, 30);
insert into emp (empno, ename, job, mgr, hiredate, sal, comm, deptno)
values (7782, 'CLARK', 'MANAGER', 7839, '1981-06-09', 2450, null, 10);
insert into emp (empno, ename, job, mgr, hiredate, sal, comm, deptno)
values (7788, 'SCOTT', 'ANALYST', 7566, '1987-04-19', 3000, null, 20);
insert into emp (empno, ename, job, mgr, hiredate, sal, comm, deptno)
values (7839, 'KING', 'PRESIDENT', null, '1981-11-17', 5000, null, 10);
insert into emp (empno, ename, job, mgr, hiredate, sal, comm, deptno)
values (7844, 'TURNER', 'SALESMAN', 7698,'1981-09-08', 1500, 0, 30);
insert into emp (empno, ename, job, mgr, hiredate, sal, comm, deptno)
values (7876, 'ADAMS', 'CLERK', 7788, '1987-05-23', 1100, null, 20);
insert into emp (empno, ename, job, mgr, hiredate, sal, comm, deptno)
values (7900, 'JAMES', 'CLERK', 7698, '1981-12-03', 950, null, 30);
insert into emp (empno, ename, job, mgr, hiredate, sal, comm, deptno)
values (7902, 'FORD', 'ANALYST', 7566, '1981-12-03', 3000, null, 20);
insert into emp (empno, ename, job, mgr, hiredate, sal, comm, deptno)
values (7934, 'MILLER', 'CLERK', 7782, '1982-01-23', 1300, null, 10);
insert into salgrade (grade, losal, hisal) values (1, 700, 1200);
insert into salgrade (grade, losal, hisal) values (2, 1201, 1400);
insert into salgrade (grade, losal, hisal) values (3, 1401, 2000);
insert into salgrade (grade, losal, hisal) values (4, 2001, 3000);
insert into salgrade (grade, losal, hisal) values (5, 3001, 9999);
如下图所示,执行完上面的SQL语句后,就有数据库scott和三张表、以及各个表中的数据了。
准备工作完毕后,咱们进入正题。
查询工资高于500或岗位为MANAGER的员工,同时要求员工姓名的首字母为大写的J,如下:
如下图所示,因为工资(即属性sal)、岗位(即属性job)、员工姓名(即属性ename)都存在于emp表中,所以我们选择select from emp查询emp表。然后要在where子句中指明筛选条件为工资高于500或岗位为MANAGER,并且通过模糊匹配指明筛选条件为员工姓名的首字母要是大写的J。
查询员工的姓名、部门号以及工资,按部门号升序并且员工工资降序的方式进行显示,如下:
如下图所示,因为员工姓名(即属性ename)、部门号(即属性deptno)、工资(即属性sal)都存在于emp表中,所以我们选择select from emp查询emp表。然后要在select的属性列表中指明要查询的属性为姓名、部门号和工资,要在order by子句中依次指明按部门号排升序和按员工工资排降序,即不同部门的员工按照部门号排升序,而同一部门的员工按员工工资排降序。
查询员工信息,按年薪降序显示,如下:
先说一下,【年薪=12个月的月薪+最后的年终奖】,而因为员工姓名(即属性ename)、月薪(即属性sal)、年终奖(即属性comm)都存在于emp表中,所以我们选择select from emp查询emp表。
然后注意,在<
答案:ifnull(val1,val2)函数具有的特性是,把表示年终奖的comm传给参数val1、把0传给参数val2后,未来如果comm的值是NULL,则该函数就会返回0,如果comm的值不是NULL,则该函数才会返回comm的值,所以我们就能根据ifnull函数的特性、通过表达式【年薪=12个月的月薪+ifnull(comm,0)】来正确地计算年薪了。
有了计算年薪的方案后,剩下的步骤就简单了,如下图所示,只需在select的属性列表中指明要查询的属性为姓名和年薪,然后在order by子句中指明按年薪进行降序排序即可。
查询工资最高的员工的姓名和岗位,如下:
因为工资(即属性sal)、员工姓名(即属性ename)、岗位(即属性job)都存在于emp表中,所以我们选择select from emp查询emp表。
方式一:因为我们不知道表中的最高工资是多少,所以在查询工资最高的员工的姓名和岗位前,我们要先通过聚合函数max计算出表中的最高工资是多少,然后再通过where子句和该最高工资筛选出该员工的姓名和岗位,演示如下。
方式二:我们也可以使用子查询(关于子查询,会在下文中详细说明),将表示第一次查询的SQL语句用括号括起来,作为最高工资直接在表示第二次查询的SQL语句中使用。演示如下:
查询工资高于平均工资的员工的姓名和工资,如下:
因为工资(即属性sal)、员工姓名(即属性ename)都存在于emp表中,所以我们选择select from emp查询emp表。
方式一:因为我们不知道表中的平均工资是多少,所以在查询工资高于平均工资的员工的姓名和工资前,我们要先通过聚合函数avg计算出表中的平均工资是多少,然后再通过where子句和该平均工资筛选出该员工的姓名和工资,演示如下。
方式二:我们也可以使用子查询(关于子查询,会在下文中详细说明),将表示第一次查询的SQL语句用括号括起来,作为平均工资直接在表示第二次查询的SQL语句中使用。演示如下:
查询每个部门的平均工资和最高工资,如下:
如下图所示,因为工资(即属性sal)、部门编号(即属性deptno)都存在于emp表中,所以我们选择select from emp查询emp表。然后在group by子句中指明按照部门号进行分组,并在select语句中使用聚合函数avg和max分别查询每个部门的平均工资和最高工资即可。
查询平均工资低于2000的部门号和它的平均工资,如下:
如下图所示,因为工资(即属性sal)、部门编号(即属性deptno)都存在于emp表中,所以我们选择select from emp查询emp表。然后在group by子句中指明按照部门号进行分组,在select语句中使用聚合函数avg查询每个部门的平均工资,并在having子句中指明筛选条件为平均工资小于2000即可得到最终结果。
查询每种岗位的雇员总数和平均工资,如下:
如下图所示,因为岗位(即属性job)、工资(即属性sal)都存在于emp表中,所以我们选择select from emp查询emp表。然后在group by子句中指明按照岗位进行分组,并在select语句中使用聚合函数count和avg分别查询每种岗位的雇员总数和平均工资即可。
如下图所示,有时为了节省MySQL的空间资源,我们会把本可以用一张表存储的数据通过多张表存储起来,然后再将多张表通过某个在每张表中都存在的属性(如下图的class_id属性就在每张表中都存在)关联起来,这是我们曾经在讲解外键约束时说过的内容。
而当数据被分散在多张表中存储时,有时候会在MySQL中发生这样的情景:现在有一个需求,就是需要select语句将表1中的某些属性列和表2中的某些属性列在一张表中显示出来,那么很显然,此时不论是靠【select from 表1】还是靠【select from 表2】都无法解决问题,毕竟表1无从知晓表2中的属性,表2也无从知晓表1中的属性。
那么该怎么办呢?此时就需要通过多表查询才能做到这一点。咱们先介绍一下多表查询,如下。
如上图所示,我们可以看到,通过多表查询这样的方式,我们就可以把表1和表2拼接在一起形成一张更大的表,所以这样一来,通过select语句将表1中的某些属性列和表2中的某些属性列放在一张表中显示出来的需求也就很好满足了,这就是上面提出的问题【那么该怎么办呢?】的答案。
同时注意,在本篇文章的第一段中说过【因为多表查询本质上依然是单表查询】这样一句话,走到这里我们就能深刻理解到,就是因为多表查询本质上只是将多张小表合并成一张大表,然后在这张大表中做查询,所以才说多表查询本质上依然是单表查询。
走到这里,对多表查询的基本介绍就进行完毕了,接下来咱们做一些多表查询的实操,如下。
显示部门号为10的部门名、员工名和员工工资,如下:
如下图所示,因为员工姓名(即属性ename)、工资(即属性sal)只存在于emp表中,部门名(即属性dname)只存在于dept表中,所以我们要【select from emp,dept】多表查询emp和dept表。然后要在where子句中指明筛选条件为员工表中的部门号等于部门表中的部门号(这是在过滤笛卡尔积中无意义的数据),并且指明要查询部门号为10的数据。
显示各个员工的姓名、工资和工资等级,如下:
因为员工姓名(即属性ename)、工资(即属性sal)只存在于emp表中,工资等级(即属性grade)只存在于salgrade表中,所以我们要【select from emp,salgrade】多表查询emp和salgrade表。
然后要知道的是,如下图所示(下图的上半部分是取两张表笛卡尔积的过程,下图的下半部分是两张表的笛卡尔积),在员工表和工资等级表的笛卡尔积中,是将员工表中的每一个员工的信息都和工资等级表中的所有工资等级信息进行了组合,而实际上一个员工的信息只有和自己工资对应的工资等级信息进行组合才是有意义的,如果一个员工的工资不属于某个工资等级,但却将该工资等级的所有信息拼接在了员工信息里,那这条数据就没有意义(比如下图下半部分红框处的数据就没有意义,因为明明这个员工的工资是800,不在1201到1400这个区间中,却将这个区间代表的工资等级的所有信息拼接在了该员工的信息中),因此需要拿着员工的工资根据工资等级表中的各个工资等级的最低工资和最高工资判断一个员工的工资是否属于该工资等级,进而筛选出有意义的数据。
结合上面的思路,我们可知只需要在select from的时候多表查询emp表和salgrade表,并在where子句中指明筛选条件为员工的工资sal在losal和hisal之间(即如果sal在区间之内,则该条数据有意义,如果不在区间之内,则该条数据无意义,将其过滤掉),即可查询出最终结果,如下。
注意,我们不仅可以多表查询不同的多张表(即取不同表的笛卡尔积),还可以多表查询相同的多张表(即对同一张表取笛卡尔积),而像这样多表查询相同的多张表的情况就叫做自连接。
那自连接有什么用呢?咱们直接通过实操来说明其作用,如下。
显示员工FORD的上级领导的编号和姓名,如下:
因为员工姓名(即属性ename)、员工的编号(即属性empno)都只存在于emp表中,所以我们选择select from emp查询emp表。
然后注意,因为员工FORD的上级领导本质也是一个员工,所以理论上领导的员工姓名(即属性ename)和员工编号(即属性empno)也一定存在于emp表中,如下图1所示,可以发现的确如此,并且员工FORD的信息和他的领导的信息位于不同的行上。
这时我们就可以通过将这张表自连接形成一个更大的表,以让这个更大的表中存在一条【由员工FORD的信息和他的领导的信息】组成的数据(注意,由于自连接是对同一张表取笛卡尔积,因此在进行自连接时至少需要给该表取一个别名,否则未来用户在选中一个属性时,MySQL会分不清该属性属于哪张表),如下图2的红框处所示,可以发现的确有这样的一条数据。
然后剩下的工作就简单了,我们只需在这个更大的表中通过where子句将该条数据筛选出来(如何筛选呢?先让where子句把ename等于FORD的数据晒出来,然后加上and关键字把【员工的领导编号mgr等于领导的员工号empno的数据】筛选出来即可,注意这一步是在过滤掉所有没有意义的数据),并按照题目的要求进行显示即可完成题目的要求,如下图3所示。
说一下,除了上面的方法外,咱们还可以通过子查询完成该题目,比如说先对员工表emp进行查询得到FORD的领导的编号,然后再根据领导的编号对员工表进行查询得到FORD领导的姓名。如下。
所以走到这里我们就能明白自连接的作用,即:如果在一张表中,某条数据A的某些属性和另一条数据B有关系(比如在上面的情景中,就是一个员工A的属性mgr和另一个员工B有关系),并且现在又有显示数据B的信息的需求,那么就可以通过自连接将表中通过该属性进行关联的两条数据组合起来形成一条数据,然后再将这条数据筛选出来并按需进行显示(再次强调一下,想要通过自连接的方式显示数据B的信息,则数据A必须有某些属性和数据B有关系,否则后序在筛选数据时就没有依据、自连接也就没有意义)。
先说一下,子查询可分为单行单列子查询、单行多列子查询、多行单列子查询、多行多列子查询、以及在from子句中使用的子查询。
单行单列子查询
单行单列子查询就是只返回一条数据的一个属性值的子查询。
显示SMITH同一部门的员工,如下:
如下图所示,因为部门编号(即属性deptno)、员工姓名(即属性ename)都存在于emp表中,所以我们选择select from emp查询emp表。然后在子查询中查询SMITH所在的部门号,并在where子句中指明筛选条件为员工部门号等于子查询返回的部门号即可。
多行单列子查询
多行单列子查询就是返回多条数据的一个属性值的子查询。接下来咱们结合实际案例来介绍多行单列子查询,如下。
(in关键字)题目:显示和10号部门的工作岗位相同的员工的名字、岗位、工资和部门号,但是不包含10号部门的员工,如下:
如下图所示,因为员工姓名(即属性ename)、岗位(即属性job)、工资(即属性sal)、部门编号(即属性deptno)都存在于emp表中,所以我们选择select from emp查询emp表。
然后因为多行单列子查询本质是返回了多条数据的一个属性值(如下图红框处所示),也就是多个值,所以在多行单列子查询中查询出10号部门的所有岗位有哪些后,在where子句中指明筛选条件时需要加上in关键字,以判断员工的工作岗位是否是子查询得到的若干岗位中的一个,如果不是则将该员工的信息过滤掉,如果是则保留。由于题目要求筛选出来的员工不包含10号部门的,因此还需要在where子句中指明筛选条件为部门号不等于10。
(all关键字)题目:显示工资比30号部门的所有员工的工资高的员工的姓名、工资和部门号,如下:
如下图所示,因为员工姓名(即属性ename)、工资(即属性sal)、部门编号(即属性deptno)都存在于emp表中,所以我们选择select from emp查询emp表。
然后因为多行单列子查询本质是返回了多条数据的一个属性值(如下图红框处所示),也就是多个值,所以在多行单列子查询中查询出30号部门的所有员工的工资后,在where子句中指明筛选条件时需要加上all关键字,以判断员工的工资是否高于子查询得到的所有工资,如果不是则将该员工的信息过滤掉,如果是则保留。
除了上面的方法外,实际这道题也等价于找出工资高于30号部门的最高工资的员工,因此也可以使用单行单列子查询得到30号部门的最高工资,然后判断员工的工资是否高于子查询得到的最高工资即可。如下:
(any关键字)题目:显示工资比30号部门的任意员工的工资高的员工的姓名、工资和部门号,包含30号部门的员工,如下:
如下图所示,因为员工姓名(即属性ename)、工资(即属性sal)、部门编号(即属性deptno)都存在于emp表中,所以我们选择select from emp查询emp表。
然后因为多行单列子查询本质是返回了多条数据的一个属性值(如下图红框处所示),也就是多个值,所以在多行单列子查询中查询出30号部门的所有员工的工资后,在where子句中指明筛选条件时需要加上any关键字,以判断员工的工资是否高于子查询得到的多个工资中的任意一个,如果不是则将该员工的信息过滤掉,如果是则保留。
除了上面的方法外,实际这道题也等价于找出工资高于30号部门的最低工资的员工,因此也可以使用单行单列子查询得到30号部门的最低工资,然后判断员工的工资是否高于子查询得到的最低工资即可。如下:
为什么单行单列子查询不需要使用in、all、any关键字,而多行单列子查询需要呢?很简单,因为前者只会查到一条数据的属性值,而后者会查到多条数据的属性值。换言之,往后我们判断子查询是否可以使用这3个关键字的方式就是看子查询查出的数据是否是多条,如果是,则可以使用,如果不是,则不可以使用。
单行多列子查询
单行多列子查询就是返回一条数据的多个属性值的子查询。接下来咱们结合实际案例来介绍单行多列子查询,如下。
题目:显示和SMITH的部门和岗位完全相同的员工,不包含SMITH本人,如下:
因为员工姓名(即属性ename)、岗位(即属性job)、部门编号(即属性deptno)都存在于emp表中,所以我们选择select from emp查询emp表。
如下图所示,先查询SMITH所在部门的部门号和他的岗位,然后再将这个查询作为子查询,并在where子句中指明筛选条件为部门号和岗位等于子查询得到的部门号和岗位,并且员工的姓名不为SMITH即可。
多行多列子查询
单行多列子查询就是返回一条数据的多个属性值的子查询。接下来咱们结合实际案例来介绍单行多列子查询,如下。
剩下的内容笔者稍后再补充~