LeetCode(SQL)难度-中等

LeetCode(SQL)难度-中等

注:排名知识点(题目1->思路来源于牛客-小数志(公众号))

  1. 连续排名,例如3000,2000,2000,1000排名结果为1-2-3-4,体现同薪不同名,排名类似于编号
  2. 同薪同名,但总排名不连续,如上薪水,排名为1-2-2-4
  3. 同薪同名,总排名连续,如上薪水,排名为1-2-2-3

题目1:编写一个 SQL 查询,获取 Employee 表中第 n 高的薪水(Salary)LeetCode(SQL)难度-中等_第1张图片

思路1:单表查询

本题只需考虑全局第N高的一个,可用order by+limit

  • 本题情况为排名中的第三种同薪同名,总排名连续,所以需要利用group by按薪水分组后再order by

  • 排名第N高意味着要跳过N-1个薪水,由于无法直接用limit N-1,所以需先在函数开头处理N为N=N-1
    注1: 这里不能直接用limit N-1是因为limit和offset字段后面只接受正整数(意味着0、负数、小数都不行)或者单一变量(意味着不能用表达式),也就是说想取一条,limit 2-1、limit 1.1这类的写法都是报错的
    注2: 这种解法形式最为简洁直观,但仅适用于查询全局排名问题,如果要求各分组的每个第N名,则该方法不适用;而且也不能处理存在重复值的情况

CREATE FUNCTION getNthHighestSalary(N INT) RETURNS INT
BEGIN
    SET N:=N-1; ##因为limit不能出现表达式,所以需提前定义,注意要有分号
  RETURN (
     SELECT salary
     FROM  employee
     GROUP BY salary  ##可能出现同薪,需要分组
     ORDER BY salary DESC
     LIMIT N, 1
  );
END
思路2:子查询
  • 排名第N高的薪水意味着该表中粗在N-1个比其更高的薪水
  • 注意这里的N-1个更高的薪水是去重后的N-1个,实际对应人数可能不止N-1个
  • 最后返回的薪水也应该去重,因为可能不止一个薪水排名第N
  • 由于对于每个薪水的where条件都要执行一遍子查询,注定其效率低下
CREATE FUNCTION getNthHighestSalary(N INT) RETURNS INT
BEGIN
  RETURN (
      SELECT e.salary
      FROM  employee e
      WHERE
      (SELECT count(DISTINCT salary) FROM employee where salary>e.salary) = N-1 ##表示前面有N-1的不同的薪资比第N个薪资大
  );
END
思路3:自连接

注: 一般来说,能用子查询解决的问题也能用连接解决

  • 两表自连接,连接条件设定为表1的salary小于表2的salary
  • 以表1的salary分组,统计表1中每个salary分组后对应表2中salary唯一值个数,即去重
  • 限定步骤2中having 计数个数为N-1,即实现了该分组中表1salary排名为第N个
  • 考虑N=1的特殊情形(特殊是因为N-1=0,计数要求为0),此时不存在满足条件的记录数,但仍需返回结果,所以连接用left join
  • 如果仅查询薪水这一项值,那么不用left join当然也是可以的,只需把连接条件放宽至小于等于、同时查询个数设置为N即可。因为连接条件含等号,所以一定不为空,用join即可。
CREATE FUNCTION getNthHighestSalary(N INT) RETURNS INT
BEGIN
  RETURN (
      SELECT e1.salary
      FROM  employee e1 inner join employee e2
      on e1.salary <= e2.salary
      GROUP by  e1.salary
      HAVING count(DISTINCT e2.salary) = N
  );
END
思路4:笛卡尔积
CREATE FUNCTION getNthHighestSalary(N INT) RETURNS INT
BEGIN
  RETURN (
      SELECT DISTINCT e1.salary
      FROM employee e1, employee e2 
      WHERE e1.salary <= e2.salary
      GROUP BY e1.salary
      HAVING count(DISTINCT e2.salary) = N
  );
END
思路5:自定义变量(不懂)

注: 以上方法2-4中均存在两表关联的问题,表中记录数少时尚可接受,当记录数量较大且无法建立合适索引时,实测速度会比较慢,用算法复杂度来形容大概是O(n^2)量级(实际还与索引有关)。那么,用下面的自定义变量的方法可实现O(2*n)量级,速度会快得多,且与索引无关。

  • 自定义变量实现按薪水降序后的数据排名,同薪同名不跳级,即3000、2000、2000、1000排名后为1、2、2、3
  • 对带有排名信息的临时表二次筛选,得到排名为N的薪水
  • 因为薪水排名为N的记录可能不止1个,用distinct去重
CREATE FUNCTION getNthHighestSalary(N INT) RETURNS INT
BEGIN
  RETURN (
     SELECT 
          DISTINCT salary 
      FROM 
          (SELECT 
                salary, @r:=IF(@p=salary, @r, @r+1) AS rnk,  @p:= salary 
            FROM  
                employee, (SELECT @r:=0, @p:=NULL)init 
            ORDER BY 
                salary DESC) tmp
      WHERE rnk = N
  );
END

本题将查询语句封装成一个自定义函数并给出了模板,实际上是降低了对函数语法的书写要求和难度,而且提供的函数写法也较为精简。然而,自定义函数更一般化和常用的写法应该是分三步:

  • 定义变量接收返回值
  • 执行查询条件,并赋值给相应变量
  • 返回结果
CREATE FUNCTION getNthHighestSalary(N INT) RETURNS INT
BEGIN
    # i 定义变量接收返回值
    DECLARE ans INT DEFAULT NULL;  
    # ii 执行查询语句,并赋值给相应变量
    SELECT 
        DISTINCT salary INTO ans
    FROM 
        (SELECT 
            salary, @r:=IF(@p=salary, @r, @r+1) AS rnk,  @p:= salary 
        FROM  
            employee, (SELECT @r:=0, @p:=NULL)init 
        ORDER BY 
            salary DESC) tmp
    WHERE rnk = N;
    # iii 返回查询结果,注意函数名中是 returns,而函数体中是 return
    RETURN ans;
END
思路6:自定义变量
  • row_number():同薪不同名,相当于行号,相当于排名知识点中的第一个1-2-3-4
  • rank():同薪同名,有跳级,相当于1-2-2-4
  • dense_rank():同薪同名,无跳级,相当于1-2-2-3
CREATE FUNCTION getNthHighestSalary(N INT) RETURNS INT
BEGIN
  RETURN (
        SELECT 
            DISTINCT salary
        FROM 
            (SELECT 
                salary, dense_rank() over(ORDER BY salary DESC) AS rnk
             FROM 
                employee) tmp
        WHERE rnk = N
  );
END

窗口函数
LeetCode(SQL)难度-中等_第2张图片

题目2:编写一个 SQL 查询来实现分数排名。如果两个分数相同,则两个分数排名(Rank)相同。请注意,平分后的下一个名次应该是下一个连续的整数值。换句话说,名次之间不应该有“间隔”

LeetCode(SQL)难度-中等_第3张图片

思路:利用开窗函数,进行排序,也就是第一题所提到的第三种排序
select Score,dense_rank() over(order by Score desc) as 'Rank'##必须加引号,否则会出现错误
from Scores;
select a.Score Score,
    (select count(distinct b.score) from Scores b where b.score>=a.Score ) 'Rank'
    ##排名的思路,需要找出a.Score前面有N个大于他的,a.Score的排名则是N+1,也就是大于a.Score不同分数的个数,可以再纸上举出一个小例子,即可明白,例如43321,1是第4名,distinct 4:1个,distinct 3:1个,distinct 2:1个,用>=也就是1所在的第4名
FROM Scores a
order by a.Score desc

题目3:部门工资最高的员工,Employee 表包含所有员工信息,每个员工有其对应的 Id, salary 和 department Id;Department 表包含公司所有部门的信息

LeetCode(SQL)难度-中等_第4张图片LeetCode(SQL)难度-中等_第5张图片##### 思路:先查找Employee表中的部门中的最高薪资,在连接两个表。

select 
      Department.Name as Department,
      Employee.Name as Employee, 
      Salary
from Employee inner join Department
on Department.ID = Employee.DepartmentId
where (Employee.DepartmentId,Salary) IN 
      (SELECT DepartmentId,MAX(Salary)##可以先查找部门内的最高薪资,在Employee表,然后再去查找名字,连接两个表
       FROM Employee
       GROUP BY DepartmentId)

题目4:换座位,小美是一所中学的信息科技老师,她有一张 seat 座位表,平时用来储存学生名字和与他们相对应的座位 id。其中纵列的 id 是连续递增的,小美想改变相邻俩学生的座位。如果学生人数是奇数,则不需要改变最后一个同学的座位

LeetCode(SQL)难度-中等_第6张图片

思路1:首先找出有多少个座位,然后判断id在为奇数的情况下,是否为最后一个座位,若不是则id+1,如果为最后一个,则id不变,若id为偶数,则id-1
SELECT
    (CASE
        WHEN MOD(id, 2) != 0 AND counts != id THEN id + 1 ##奇数且不是最后一个座位,则和下一个id交换
        WHEN MOD(id, 2) != 0 AND counts = id THEN id ##如果学生人数是奇数,则不需要改变最后一个同学的座位
        ELSE id - 1##偶数,则id-1和奇数交换
    END) AS id,
    student
FROM
    seat,
    (SELECT 
        COUNT(*) AS counts
    FROM
        seat) AS seat_counts  ##查找座位的个数
ORDER BY id ASC;
思路2:先利用(id+1)^1-1交换id,然后连接座位表和更新id后的座位表,然后id升序排列,具体思路如表所示:LeetCode(SQL)难度-中等_第7张图片

LeetCode(SQL)难度-中等_第8张图片

SELECT
    s1.id, COALESCE(s2.student, s1.student) AS student ##返回第一个非空的表达式
FROM
    seat s1
        LEFT JOIN
    seat s2 ON ((s1.id + 1) ^ 1) - 1 = s2.id ##异或,就是^两边,第一次相加,第二次相减,以此类推
ORDER BY s1.id;

题目5 :编写一个 SQL 查询,查找所有至少连续出现三次的数字(有两个字段 ID, Num,表名Log)要求输出Num的值。

思路:连续出现的意味着相同数字的 Id 是连着的,由于这题问的是至少连续出现 3 次,我们使用 Logs 并检查是否有 3 个连续的相同数字.
Select distinct L1.Num ConsecutiveNums ##必须写distinct ,只输出1个值
from Logs L1,Logs L2, Logs L3
where L1.ID=L2.ID+1 AND L2.ID=L3.ID+1 AND L1.Num=L2.Num and L2.Num=L3.Num

你可能感兴趣的:(LeetCode(SQL)难度-中等)