项目开发中,在进行数据库表结构设计时,会根据业务需求及业务模块之间的关系,分析并设计表结构,由于业务之间相互关联,所以各个表结构之间也存在着各种联系,基本上分为三种:
比如部门表与员工表之间的关系就是一对多,即一个部门对应多个员工,一个员工对应一个部门。
想要实现这种关系,需要在多的一方建立外键,指向一的一方的主键,如下图所示。
比如学生与课程的关系就是多对多的关系,一个学生可以选修多门课程,一门课程也可以供多个学生选择。
想要实现这种关系,需要建立第三张中间表,中间表至少包含两个外键,分别关联两方主键。
比如用户与用户信息详情之间的关系就是一对一关系,多用于单表拆分,将一张表的基础字段放在一张表中,其他详情字段放在另一张表中,以提升操作效率。
想要实现这种关系,需要在任意一方加入外键,关联另外一方的主键,并且设置外键为唯一的(UNIQUE)
执行下述SQL语句进行表的构建,一下面的两个表为例子,
-- 创建dept表,并插入数据
create table dept(
id int auto_increment comment 'ID' primary key,
name varchar(50) not null comment '部门名称'
)comment '部门表';
INSERT INTO dept (id, name) VALUES (1, '研发部'), (2, '市场部'),(3, '财务部'), (4,'销售部'), (5, '总经办'), (6, '人事部');
-- 创建emp表,并插入数据
create table emp(
id int auto_increment comment 'ID' primary key,
name varchar(50) not null comment '姓名',
age int comment '年龄',
job varchar(20) comment '职位',
salary int comment '薪资',
entrydate date comment '入职时间',
managerid int comment '直属领导ID',
dept_id int comment '部门ID'
)comment '员工表';
-- 添加外键
alter table emp add constraint fk_emp_dept_id foreign key (dept_id) references
dept(id);
INSERT INTO emp (id, name, age, job,salary, entrydate, managerid, dept_id)
VALUES
(1, '金庸', 66, '总裁',20000, '2000-01-01', null,5),
(2, '张无忌', 20, '项目经理',12500, '2005-12-05', 1,1),
(3, '杨逍', 33, '开发', 8400,'2000-11-03', 2,1),
(4, '韦一笑', 48, '开发',11000, '2002-02-05', 2,1),
(5, '常遇春', 43, '开发',10500, '2004-09-07', 3,1),
(6, '小昭', 19, '程序员鼓励师',6600, '2004-10-12', 2,1),
(7, '灭绝', 60, '财务总监',8500, '2002-09-12', 1,3),
(8, '周芷若', 19, '会计',48000, '2006-06-02', 7,3),
(9, '丁敏君', 23, '出纳',5250, '2009-05-13', 7,3),
(10, '赵敏', 20, '市场部总监',12500, '2004-10-12', 1,2),
(11, '鹿杖客', 56, '职员',3750, '2006-10-03', 10,2),
(12, '鹤笔翁', 19, '职员',3750, '2007-05-09', 10,2),
(13, '方东白', 19, '职员',5500, '2009-02-12', 10,2),
(14, '张三丰', 88, '销售总监',14000, '2004-10-12', 1,4),
(15, '俞莲舟', 38, '销售',4600, '2004-10-12', 14,4),
(16, '宋远桥', 40, '销售',4600, '2004-10-12', 14,4),
(17, '陈友谅', 42, null,2000, '2011-10-12', 1,null);
多表查询就是指从多张表中查询数据。原来查询单表数据,执行的SQL形式为:select * from emp;
,那么我们要执行多表查询,就只需要使用逗号分隔多张表即可,如: select * from emp , dept;
, 具体的执行结果如下:
此时,我们看到查询结果中包含了大量的结果集,总共102条记录,而这其实就是员工表emp所有的记录(17) 与 部门表dept所有记录(6) 的所有组合情况,这种现象称之为笛卡尔积。接下来,就来简单介绍下笛卡尔积。
**笛卡尔积: **笛卡尔乘积是指在数学中,两个集合A集合 和 B集合的所有组合情况。
而在多表查询中,我们是需要消除无效的笛卡尔积的,只保留两张表关联部分的数据,比如下面的数据,我们只需要保存dept_id
相等的行,而不相等的行并没有用,可以舍去,
在SQL语句中,如何来去除无效的笛卡尔积呢? 我们可以给多表查询加上连接查询的条件即可,如下:
select * from emp , dept where emp.dept_id = dept.id;
内连接查询的是两张表交集部分的数据。(也就是绿色部分的数据)
内连接的语法分为两种: 隐式内连接、显式内连接。先来学习一下具体的语法结构。
隐式内连接
SELECT 字段列表 FROM 表1 , 表2 WHERE 条件 ... ;
显式内连接
SELECT 字段列表 FROM 表1 [ INNER ] JOIN 表2 ON 连接条件 ... ;
代码演示如下:
# 查询每一个员工的姓名,及关联的部门的名称 (隐式内连接实现)
select emp.name , dept.name from emp , dept where emp.dept_id = dept.id ;
-- 为每一张表起别名,简化SQL编写
select e.name,d.name from emp e , dept d where e.dept_id = d.id;
# 查询每一个员工的姓名 , 及关联的部门的名称 (显式内连接实现)
select e.name, d.name from emp e inner join dept d on e.dept_id = d.id;
-- 为每一张表起别名,简化SQL编写
select e.name, d.name from emp e join dept d on e.dept_id = d.id;
**注意:**一旦为表起了别名,就不能再使用表名来指定对应的字段了,此时只能够使用别名来指定字段。
外连接分为两种,分别是:左外连接(左边蓝色部分) 和 右外连接(右边黄色部分)。具体的语法结构为:
左外连接
SELECT 字段列表 FROM 表1 LEFT [ OUTER ] JOIN 表2 ON 条件 ... ;
左外连接相当于查询表1(左表)的所有数据,当然也包含表1和表2交集部分的数据。
右外连接
SELECT 字段列表 FROM 表1 RIGHT [ OUTER ] JOIN 表2 ON 条件 ... ;
右外连接相当于查询表2(右表)的所有数据,当然也包含表1和表2交集部分的数据。
代码演示如下:
示例1:
# 查询emp表的所有数据, 和对应的部门信息
select e.*, d.name from emp e left join dept d on e.dept_id = d.id;
查询得到的结果如下:
示例2:
# 查询dept表的所有数据, 和对应的员工信息(右外连接)
select d.*, e.* from emp e right outer join dept d on e.dept_id = d.id;
查询到的结果如下:
自连接查询,顾名思义,就是自己连接自己,也就是把一张表连接查询多次。我们先来学习一下自连接的查询语法:
SELECT 字段列表 FROM 表A 别名A JOIN 表A 别名B ON 条件 ... ;
而对于自连接查询,可以是内连接查询,也可以是外连接查询。
代码演示如下:
示例1:
# 查询员工 及其 所属领导的名字
select a.name , b.name from emp a , emp b where a.managerid = b.id;
查询结果如下:
示例2:
# 查询所有员工 emp 及其领导的名字 emp , 如果员工没有领导, 也需要查询出来
select a.name '员工', b.name '领导' from emp a left join emp b on a.managerid = b.id;
查询结果如下:
注意:
在自连接查询中,必须要为表起别名,要不然我们不清楚所指定的条件、返回的字段,到底是哪一张表的字段。
联合查询使用的是 union
关键字,对于联合查询,就是把多次查询的结果合并起来,形成一个新的查询结果集,其具体语法如下:
SELECT 字段列表 FROM 表A ...
UNION [ ALL ]
SELECT 字段列表 FROM 表B ....;
union all
会将全部的数据直接合并在一起,union
会对合并之后的数据去重。代码演示如下:
# 将薪资低于 5000 的员工 , 和 年龄大于 50 岁的员工全部查询出来
# 当然,上面的条件可以使用 or 连接条件来查询,这里我们使用联合查询来解决
select * from emp where salary < 5000
union all
select * from emp where age > 50;
查询结果如下:
可以看到,使用 union all
仅仅是进行了一个表的字段的合并,可能是含有重复元素的。
而如果使用 union
的话,其结果如下:
可以发现,数据是进行了去重处理的,没有重复的数据。
如果多条查询语句查询出来的结果,字段数量不一致,在进行union/union all联合查询时,将会报错。如:
SQL语句中嵌套SELECT
语句,称为嵌套查询,又称子查询。
SELECT * FROM t1 WHERE column1 = ( SELECT column1 FROM t2 );
子查询外部的语句可以是 INSERT / UPDATE / DELETE / SELECT
的任何一个。
根据子查询结果不同,子查询分为下面四类:
子查询返回的结果是单个值(数字、字符串、日期等),最简单的形式,这种子查询称为标量子查询。
代码示例如下:
示例1:
# 查询 "销售部" 的所有员工信息
select * from emp where dept_id = (select id from dept where name = '销售部')
上述语句中 select id from dept where name = '销售部'
这个子语句的结果是一个标量,一个字符串值,所以为标量子查询,其结果如下:
示例2:
# 查询在 "方东白" 入职之后的员工信息
select * from emp where entrydate > (select entrydate from emp where name = '方东白');
同样,该示例应该先查询方东白
的入职时间,然后查询比起入职时间晚的员工的信息,结果如下:
子查询返回的结果是一列(可以是多行),这种子查询称为列子查询。
常用的操作符:IN, NOT IN, ANY, SOME, ALL
操作符 | 描述 |
---|---|
IN |
在指定的集合范围之内,多选一 |
NOT IN |
不在指定的集合范围之内 |
ANY |
子查询返回列表中,有任意一个满足即可 |
SOME |
与ANY 等同,使用SOME 的地方都可以使用ANY |
ALL |
子查询返回列表的所有值都必须满足 |
示例1:
查询 “销售部” 和 “市场部” 的所有员工信息
分解为以下两步:
# 查询 "销售部" 和 "市场部" 的部门ID
select id from dept where name = '销售部' or name = '市场部';
# 根据部门ID, 查询员工信息
select * from emp where dept_id in (select id from dept where name = '销售部' or name = '市场部');
查询结果如下:
示例2:
查询比 财务部 所有人工资都高的员工信息
分解为以下两步:
# 查询所有 财务部 人员工资
select id from dept where name = '财务部';
select salary from emp where dept_id = (select id from dept where name = '财务部');
# 比 财务部 所有人工资都高的员工信息
select * from emp where salary > all
( select salary from emp where dept_id = (select id from dept where name = '财务部') );
示例3:
查询比研发部其中任意一人工资高的员工信息
分解为以下两步:
# 查询研发部所有人工资
select salary from emp where dept_id = (select id from dept where name = '研发部');
# 比研发部其中任意一人工资高的员工信息
select * from emp where salary > any ( select salary from emp where dept_id =
(select id from dept where name = '研发部') );
查询结果如下:
子查询返回的结果是一行(可以是多列),这种子查询称为行子查询。常用的操作符为 =, <>, IN, NOT IN
。
示例1:
查询"张无忌" 的薪资及直属领导相同的员工信息 ;
select * from emp where (salary,managerid) =
(select salary, managerid from emp where name = '张无忌');
子查询返回的结果是多行多列,这种子查询称为表子查询。常用的操作符为 IN
。
操作示例如下:
示例1:
查询与 “鹿杖客” , “宋远桥” 的职位和薪资相同的员工信息。
该问题可以分解为两步进行查询,如下:
# 查询 "鹿杖客" , "宋远桥" 的职位和薪资
select job, salary from emp where name = '鹿1 杖客' or name = '宋远桥';
# 查询与 "鹿杖客" , "宋远桥" 的职位和薪资相同的员工信息
select * from emp where (job,salary) in
( select job, salary from emp where name = '鹿杖客' or name = '宋远桥' );
其查询结果如下:
示例2:
查询入职日期是 “2006-01-01” 之后的员工信息 , 及其部门信息
分解为两步执行:
# 入职日期是 "2006-01-01" 之后的员工信息
select * from emp where entrydate > '2006-01-01';
# 查询这部分员工, 对应的部门信息;
select e.*, d.* from
(select * from emp where entrydate > '2006-01-01') e left join dept d on e.dept_id = d.id ;
结果如下: