今天的目标仍然是难题和简单题的组合出拳,接招啦!废话不多说,我们开始吧!
经典的TOP N问题的解法;如果难度加大一点,也可以获得组内的TOP N哟。超级经典的题目!!!
Employee 表包含所有员工信息,每个员工有其对应的工号 Id,姓名 Name,工资 Salary 和部门编号 DepartmentId 。
Id | Name | Salary | DepartmentId |
---|---|---|---|
1 | Joe | 85000 | 1 |
2 | Henry | 80000 | 2 |
3 | Sam | 60000 | 2 |
4 | Max | 90000 | 1 |
5 | Janet | 69000 | 1 |
6 | Randy | 85000 | 1 |
7 | Will | 70000 | 1 |
Department 表包含公司所有部门的信息。
Id | Name |
---|---|
1 | IT |
2 | Sales |
编写一个 SQL 查询,找出每个部门获得前三高工资的所有员工。例如,根据上述给定的表,查询结果应返回:
Department | Employee | Salary |
---|---|---|
IT | Max | 90000 |
IT | Randy | 85000 |
IT | Joe | 85000 |
IT | Will | 70000 |
Sales | Henry | 80000 |
Sales | Sam | 60000 |
解释:
IT 部门中,Max 获得了最高的工资,Randy 和 Joe 都拿到了第二高的工资,Will 的工资排第三。销售部门(Sales)只有两名员工,Henry 的工资最高,Sam 的工资排第二。
题解:
对于这种分组内取前N名的问题,可以先group by然后用having count()来筛选。 比如这题,找每个部门的工资前三名,那么先在子查询中用Employee和自己做连接,连接条件是【部门相同但是工资比我高】,那么接下来按照having count(Salary) <= 3来筛选的原理是:如果【跟我一个部门而且工资比我高的人数】不超过3个,那么我一定是部门工资前三,这样内层查询可以查询出所有符合要求的员工ID,接下来外层查询就简单了。
select de.Name as Department,t.Name as Employee, t.Salary as Salary
from
(
select e1.Name,e1.Salary,e1.DepartmentId
from Employee e1 left join Employee e2
on e1.DepartmentId = e2.DepartmentId
and e1.Salary <= e2.Salary
group by e1.Name
having count(distinct e2.Salary)<=3
order by e1.Salary desc
) as t
join Department as de
on t.DepartmentId = de.Id
order by de.Name asc,t.Salary desc
易错点:
使用开窗函数获得排名(只适用于SqlServer、Orcal等支持开窗函数的数据库,MySQL环境下不可以使用开窗函数)
select de.Name as Department,t.Name as Employee,t.Salary as Salary
from
(
select Name,Salary,DepartmentId,
dense_rank() over(partition by DepartmentId order by Salary desc) as rk
from Employee
) t
join Department de
on t.DepartmentId = de.Id
where t.rk<=3
题解:考察delete的用法
分为删除一个表,或者多表的情况
eg1:有一个表,不需要指定删除哪个表
– DELETE FROM person WHERE id = 3
eg2:有两个表,要指定删除哪个表
delete p1
from Person p1 join Person p2
on p1.email = p2.email and p1.id>p2.id
先根据email进行分组,然后找出Id最小的保留。删除表时只需要让Id 不在上述范围内即可
delete from Person
where Id not in
(select t.id from
# 不加这个外层查询会报错,因为mysql 不能将select表中的某些值选出后并更新该表
# You can't specify target table 'Person' for update in FROM clause
(select min(Id) as id from Person
group by Email
) AS t
)
编写一个 SQL 查询,查找 Person 表中所有重复的电子邮箱。
题解:考察group by+having(分组后筛选)
按照邮箱分组,分组之后使用having筛选个数>=2的邮箱
select Email from Person
group by Email
having count(Email)>=2
Employee 表包含所有员工,他们的经理也属于员工。每个员工都有一个 Id,此外还有一列对应员工的经理的 Id。
给定 Employee 表,编写一个 SQL 查询,该查询可以获取收入超过他们经理的员工的姓名。在上面的表格中,Joe 是唯一一个收入超过他的经理的员工。
题解:考察自连接
使用join自连接,e1是员工表,e2是对应的部门主管表。然后让表1的工资>表2的工资即可。
select e1.Name AS Employee
from Employee as e1
join Employee as e2 # 使用join连接
on e2.Id = e1.ManagerId
where e1.Salary > e2.Salary
某网站包含两个表,Customers 表和 Orders 表。编写一个 SQL 查询,找出所有从不订购任何东西的客户。
先在订购表里找到有购买记录的用户Id,然后在所有用户里面筛选,排除这些购买过商品的用户,剩下的就是从来没买过东西的用户啦!
select Name as Customers
from Customers where Id not in
(select CustomerId from Orders)
如果顾客存在消费记录,则一定能在Orders表中匹配到,否则,Orders表对应列为null。这就是左连接,妙啊!
select c.Name as Customers
from Customers c
left join Orders o
on c.Id = o.CustomerId
where o.CustomerId is null
易错点:判断是否为null字段,应该使用 is null 或者is not null,而不是使用等于号。