牛客SQL二刷(19-24)

19、查找所有员工的last_name和first_name以及对应的dept_name

这道题的话主要是在几个表里面找到你想要的字段,然后联结起来。

SELECT e.last_name, e.first_name, dp.dept_name 
FROM employees AS e
LEFT JOIN dept_emp AS de
ON e.emp_no = de.emp_no
LEFT JOIN departments AS dp
ON de.dept_no = dp.dept_no

20、查找员工编号emp_no为10001其自入职以来的薪水salary涨幅值growth

本题严谨的思路如下:
1、先分别找到emp_no=10001的员工的第一次工资记录与最后一次工资记录
2、再将最后一次工资记录减去第一次工资记录得到入职以来salary的涨幅,最后用别名growth代替

SELECT 
(
(SELECT salary FROM salaries WHERE emp_no = '10001' ORDER BY to_date DESC LIMIT 1)  -- 按时间排序最大的时间
- (SELECT salary FROM salaries WHERE emp_no = '10001' ORDER BY to_date LIMIT 1) -- 按时间排序最小的时间
) AS growth

21、查找所有员工自入职以来的薪水涨幅情况

这道题目的重点在于找到入职时间的薪水和现在时间的薪水,等于是上面那道题目的一个延申。
所以我灵机一动,除了在讨论区看到的高赞回答,还想到了这种方法,嘿嘿。当然是不能AC的,但是是一个思路,因为这里还要联结emp_no,但是随便记录一下。

-- 不能AC的题解
SELECT 
(
(SELECT salary FROM salaries ORDER BY to_date DESC LIMIT 1)  -- 按时间排序最大的时间
- (SELECT salary FROM salaries ORDER BY to_date LIMIT 1) -- 按时间排序最小的时间
) AS growth

下面这种就是正常的能够AC的思路,将薪水表用两次,第一次用来找出现在的薪水,过滤条件就是to_date = ‘9999-01-01’,然后对于入职时候的薪水,两个表都有的,将hire_date和from_date进行联结。


SELECT a.emp_no, (b.salary - c.salary) AS growth
FROM employees AS a
INNER JOIN salaries AS b
ON a.emp_no = b.emp_no AND b.to_date = '9999-01-01'
INNER JOIN salaries AS c
ON a.emp_no = c.emp_no AND a.hire_date = c.from_date
ORDER BY growth

22、统计各个部门的工资记录数

这道题目看到各个部门就想到了要用GROUP BY然后做聚合,除此之外我们需要输出部门编号和部门名称,所以我们要将三个表进行联结,得到有部门信息有员工信息有薪水信息的一张表。

SELECT dp.dept_no, dp.dept_name, COUNT(s.salary) AS sum
FROM departments AS dp
INNER JOIN dept_emp AS de
ON dp.dept_no = de.dept_no
INNER JOIN salaries AS s
ON de.emp_no = s.emp_no
GROUP BY dp.dept_no

23、对所有员工的薪水按照salary进行按照1-N的排名

这个是经典的排序问题啦!要重点看
需要进行好好的总结,那么我们知道最简单的写法就是用窗口函数,什么叫窗口函数呢(也有叫开窗函数的)。窗口函数,也称为分析函数,窗口函数与分组聚合函数类似,但是每一行数据都生成一个结果。

下面列举一些常用的窗口函数,
获取数据排名的:

  • ROW_NUMBER() 1234
  • RANK() 1134
  • DEBSE_RANK()1123
  • PERCENT_RANK()

获取分组内的第一名或者最后一名等:

  • FIRST_VALUE() 取分组内排序后,截止到当前行,第一个值
  • LAST_VALUE() 取分组内排序后,截止到当前行,最后一个值
  • LEAD(col,n,DEFAULT) :用于统计窗口内往下第n行值。第一个参数为列名,第二个参数为往下第n行(可选,默认为1),第三个参数为默认值(当往下第n行为NULL时候,取默认值,如不指定,则为NULL)
  • LAG(col,n,DEFAULT) :与lead相反,用于统计窗口内往上第n行值。第一个参数为列名,第二个参数为往上第n行(可选,默认为1),第三个参数为默认值(当往上第n行为NULL时候,取默认值,如不指定,则为NULL)

累计分布:

  • CUME_DIST()
  • NTH_VALUE()
  • NTILE()

OVER从句
1、使用标准的聚合函数COUNT、SUM、MIN、MAX、AVG
2、使用PARTITION BY语句,使用一个或者多个原始数据类型的列
3、使用PARTITION BY与ORDER BY语句,使用一个或者多个数据类型的分区或者排序列
4、使用窗口规范

主要的语句格式就是,以RANK为例

RANK () OVER (PARTITION BY lesson ORDER BY score desc)

这个句子的意思就是以lesson为分组(如语文、数学、英语)按成绩排名

-- 方法一 窗口函数
SELECT emp_no, 
       salaries, 
       DENSE_RANK() OVER(ORDER BY salary DESC) AS rank
WHERE to_date = '9999-01-01' 
ORDER BY salary DESC, emp_no ASC

下面给出常规AC的解法!
思路为:

1、从两张相同的salaries表(分别为s1与s2)进行对比分析,先将两表限定条件设为to_date = ‘9999-01-01’,挑选出当前所有员工的薪水情况。
2、本题的精髓在于 s1.salary <= s2.salary,意思是在输出s1.salary的情况下,有多少个s2.salary大于等于s1.salary,比如当s1.salary=94409时,有3个s2.salary(分别为94692,94409,94409)大于等于它,但由于94409重复,利用COUNT(DISTINCT s2.salary)去重可得工资为94409的rank等于2。其余排名以此类推。
3、千万不要忘了GROUP BY s1.emp_no,否则输出的记录只有一条(可能是第一条或者最后一条,根据不同的数据库而定),因为用了合计函数COUNT()
4、最后先以 s1.salary 逆序排列,再以 s1.emp_no 顺序排列输出结果

-- 方法二 
SELECT s1.emp_no, 
       s1.salary, 
       COUNT(DISTINCT s2.salary) AS rank
FROM salaries AS s1, salaries AS s2
WHERE s1.salary <= s2.salary 
AND s1.to_date = '9999-01-01' 
AND s2.to_date = '9999-01-01'
GROUP BY s1.emp_no
ORDER BY s1.salary DESC, s1.emp_no ASC

24、获取所有非manager员工当前的薪水情况

思路很简单,之前写过所有员工当前的薪水情况,三个表联结,这里加一个过滤条件NOT IN 即可,找出manager。

SELECT de.dept_no, e.emp_no, s.salary
FROM employees AS e
INNER JOIN salaries AS s
ON s.emp_no = e.emp_no AND S.to_date = '9999-01-01'
INNER JOIN dept_emp AS de
ON e.emp_no = de.emp_no
WHERE de.emp_no 
NOT IN (SELECT emp_no 
        FROM dept_manager 
        WHERE to_date = '9999-01-01')

你可能感兴趣的:(SQL学习)