子查询(Subquery)是指嵌套在其他 SELECT、INSERT、UPDATE 以及 DELETE 语句中的
查询语句。
子查询的作用与多表连接查询有点类似,也是为了从多个关联的表中返回或者过滤数据。
例如,我们想要知道哪些员工的月薪大于平均月薪,可以通过子查询实现:
select e.first_name, e.last_name, e.salary
from employees e
where salary > (select avg(salary) from employees);
其中,WHERE 子句中使用了一个子查询,用于计算平均月薪。PostgreSQL 在执行以上语句
时,先执行子查询返回平均月薪;然后将该值传递给外查询使用。
子查询必须位于括号中,也称为内查询,包含子查询的查询语句被称为外查询。除了 WHERE
子句之外,其他子句中也可以使用子查询,例如 SELECT 列表、FROM 子句等。
FROM 子句中的子查询被称为派生表(Derived table),语法如下:
SELECT column1, column2, ...
FROM (subquery) AS table_alias;
其中子查询相当于创建了一个临时表 table_alias。以下语句用于获取每个部门的总月薪:
select d.department_name,
ds.sum_salary
from departments d
join (select department_id,
sum(salary) as sum_salary
from employees
group by department_id) ds
on (d.department_id = ds.department_id);
其中,子查询返回了部门编号和部门月薪合计;然后再和 departments 表进行连接查询。
如果 WHERE 子查询返回多个记录,可以使用 IN 操作符进行条件过滤:
SELECT d.department_id,
d.department_name
FROM departments d
WHERE d.department_id in (SELECT department_id FROM employees WHERE
hire_date >= date '2008-01-01');
以上查询返回了存在 2008 年 01 月 01 日以后入职员工的部门。如果想要返回包含该日期之
前入职的员工的部门,可以使用 NOT IN 操作符。
除了 IN 之外,还有一些其他进行类似过滤的操作符。
ALL 操作符与比较运算符一起使用,可以将一个值与子查询返回的列表进行比较:
SELECT first_name, last_name, salary
FROM employees
WHERE salary > all (SELECT salary FROM employees WHERE department_id = 80);
以上语句返回了月薪比销售部门(department_id = 80)所有员工都高的员工。
其他比较运算符也可以与 ALL 进行组合,例如 salary < ALL 表示月薪比销售部门所有员工
都低的员工。
ANY 操作符和 ALL 操作符使用方法类似,只是效果不同:
SELECT first_name, last_name, salary
FROM employees
WHERE salary > any (SELECT salary FROM employees WHERE department_id = 80);
以上语句返回了月薪比销售部门(department_id = 80)任何员工高的员工。
ANY 也可以和其他比较运算符一起使用,例如= ANY 实际上和 IN 的作用相同。
另外,SOME 和 ANY 是同义词。
有一类子查询,它们会引用外部查询中的列,因而与外部查询产生关联,被称为关联子查询。
返回月薪大于所在部门平均月薪的员工:
select first_name, last_name, salary
from employees o
where o.salary > (select avg(salary) from employees i where i.department_id
= o.department_id);
可以看到,子查询中使用了外查询的字段(o.department_id)。对于外部查询中的每个
员工,运行子查询返回他/她所在部门的平均月薪,然后传递给外部查询进行判断。
关联子查询对于外查询中的每一行都会运行一次(数据库可能会对此进行优化),而非
关联子查询在整个查询运行时只会执行一次
以下语句在 SELECT 列表中使用关联子查询,返回每个部门的总月薪,和上文示例
相同:
SELECT d.department_name,
(SELECT SUM(salary)
FROM employees e
WHERE e.department_id = d.department_id) AS sum_salary
FROM departments d
ORDER BY d.department_name;
子查询只能引用外查询中的字段,而不能使用同一层级中其他表中的字段
SELECT d.department_name,
t.avg_salary
FROM departments d
JOIN (SELECT avg(e.salary) AS avg_salary
FROM employees e
WHERE e.department_id = d.department_id) t;
SQL Error [42601]: ERROR: syntax error at end of input
Position: 209
以上语句在 JOIN 中引用了左侧 departments 表中的字段,产生了语法错误。为此,我们需
要使用横向子查询(LATERAL subquery)。通过增加 LATERAL 关键字,子查询可以引用左侧
表中的列:
select d.department_name,
t.sum_salary
from departments d
cross join lateral (select sum(e.salary) as sum_salary
from employees e
where e.department_id = d.department_id) t;
以上语句同样返回了每个部门的名称和总月薪。
EXISTS 操作符用于检查子查询结果的存在性。如果子查询返回任何结果,EXISTS 返回 True;
否则,返回 False。
返回了存在 2008 年 01 月 01 日以后入职员工的部门
select
d.department_id ,
d.department_name
from cps.public.departments d
where exists (
select 1 from cps.public.employees e where e.hire_date >= date('2008-01-01')
);
NOT EXISTS 操作符执行相反的操作,即子查询不返回任何结果,NOT EXISTS 返回 True;
否则,返回 False。
[NOT] IN 用于检查某个值是否属于(=)子查询的结果列表,[NOT] EXISTS 只检查子查询
结果的存在性。如果子查询的结果中存在 NULL,NOT EXISTS 结果为 True;但是,NOT IN 结
果为 False,因为 NOT (X = NULL) 的结果为 NULL。例如:
以上语句查找没有任何员工的部门,结果返回了 16 条记录。如果使用 NOT IN 操作符:
select d.department_id,
d.department_name
from departments d
where d.department_id not in (select department_id from employees);