【LeetCode高频SQL50题-基础版】打卡第7天:第36~40题

文章目录

  • 【LeetCode高频SQL50题-基础版】打卡第7天:第36~40题
    • ⛅前言
    • 按分类统计薪水
      • 题目
      • 题解
    • 上级经理已离职的公司员工
      • 题目
      • 题解
    • 换座位
      • 题目
      • 题解
    • 电影评分
      • 题目
      • 题解
    • 餐馆营业额变化增长
      • 题目
      • 题解

【LeetCode高频SQL50题-基础版】打卡第7天:第36~40题

⛅前言

  在这个博客专栏中,我将为大家提供关于 LeetCode 高频 SQL 题目的基础版解析。LeetCode 是一个非常受欢迎的编程练习平台,其中的 SQL 题目涵盖了各种常见的数据库操作和查询任务。对于计算机科班出身的同学来说,SQL 是一个基础而又重要的技能。不仅在面试过程中经常会遇到 SQL 相关的考题,而且在日常的开发工作中,掌握 SQL 的能力也是必备的。

  本专栏的目的是帮助读者掌握 LeetCode 上的高频 SQL 题目,并提供对每个题目的解析和解决方案。我们将重点关注那些经常出现在面试中的题目,并提供一个基础版的解法,让读者更好地理解问题的本质和解题思路。无论你是准备找工作还是提升自己的技能,在这个专栏中,你可以学习到很多关于 SQL 的实践经验和技巧,从而更加深入地理解数据库的操作和优化。

  我希望通过这个专栏的分享,能够帮助读者在 SQL 的领域里取得更好的成绩和进步。如果你对这个话题感兴趣,那么就跟随我一起,开始我们的 LeetCode 高频 SQL 之旅吧!

  • 博客主页:知识汲取者的博客
  • LeetCode高频SQL100题专栏:LeetCode高频SQL100题_知识汲取者的博客-CSDN博客
  • Gitee地址:知识汲取者 (aghp) - Gitee.com
  • 题目来源:高频 SQL 50 题(基础版) - 学习计划 - 力扣(LeetCode)全球极客挚爱的技术成长平台

按分类统计薪水

题目

题目来源:1907.按分类统计薪水

【LeetCode高频SQL50题-基础版】打卡第7天:第36~40题_第1张图片

题解

  • 考察知识点unionsum

分析:这一题的难点(当然这个难点是对于我而言的,可能对你而言很简单)在于对于将不同列名映射到同一个列名中来,也就是 category 这一列,居然是直接使用一个字符串常量来实现映射,平常没怎么见过这种写法,所以一时也没有想到,其实把这一点想到了应该会很简单,因为 union 还是很常见的

1)查询出处于 Low Salary 的账号数量

select 'Low Salary' category, sum(if(income < 20000, 1, 0)) accounts_count
from Accounts;
| category   | accounts_count |
| ---------- | -------------- |
| Low Salary | 1              |

2)查询出处于 Average Salary 的账号数量

select 'Average Salary' category, sum(if(income between 20000 and 50000, 1, 0)) accounts_count
from Accounts;

当然这里也可以使用 <= 和 >= 加一个 and 进行连接,用于替代 between and

| category       | accounts_count |
| -------------- | -------------- |
| Average Salary | 0              |

3)查询出处于 High Salary 的账号数量

select 'High Salary' category, sum(income > 50000) accounts_count
from Accounts;
| category    | accounts_count |
| ----------- | -------------- |
| High Salary | 3              |

4)使用 union 将前面所有的结果集进行合并

select 'Low Salary' category, sum(if(income < 20000, 1, 0)) accounts_count
from Accounts
union
select 'Average Salary' category, sum(if(income between 20000 and 50000, 1, 0)) accounts_count
from Accounts
union
select 'High Salary' category, sum(income > 50000) accounts_count
from Accounts;

温馨提示:这里更加推荐使用 union all ,性能更高,通过提交测试可以发现,使用 union 普遍在 5%~20%,union all 普遍在 50%~70%

这里也不仅仅只能使用 sum 函数,也可以使用 count 函数

select 'Low Salary' category, count(*) accounts_count
from Accounts
where income < 20000
union all
select 'Average Salary' category, count(*) accounts_count
from Accounts
where income between 20000 and 50000
union all
select 'High Salary' category, count(*) accounts_count
from Accounts
where income > 50000;

经过提交测试,发现这种写法的性能更高,普遍高达 90% 以上

上级经理已离职的公司员工

题目

题目来源:1978.上级经理已离职的公司员工

【LeetCode高频SQL50题-基础版】打卡第7天:第36~40题_第2张图片

题解

  • 考察知识点

分析:主要分为三步

  1. 查询处薪资小于30000的员工
  2. 查询出所有在职员工的id
  3. 判断小于30000的员工的 manger_id 是否在 2 所查询的结果集中

1)查询处薪资小于30000的员工

select *
from Employees
where salary < 30000;
| employee_id | name   | manager_id | salary |
| ----------- | ------ | ---------- | ------ |
| 1           | Kalel  | 11         | 21241  |
| 11          | Joziah | 6          | 28485  |

2)查询出所有在职员工的 id

select distinct employee_id
from Employees;
| employee_id |
| ----------- |
| 3           |
| 12          |
| 13          |
| 1           |
| 9           |
| 11          |

3)判断小于30000的员工的 manger_id 是否在 2 所查询的结果集中

select employee_id
from Employees
where salary < 30000 and manager_id not in (
    select distinct employee_id
    from Employees
)
order by employee_id asc;

换座位

题目

题目来源:626.换座位

【LeetCode高频SQL50题-基础版】打卡第7天:第36~40题_第3张图片

题解

  • 考察知识点mod

分析:陷入了思维定式,我下意识的选择奖两个记录像冒泡排序一样进行两两交换,结果发现自己并不知道如何实现。后面看了题解,发现居然就是通过修改id即可实现两两交换,一下没想到,看完之后我就悟了,具体的实现思路如下:

  1. id为奇数的统一加一
  2. id为偶数的统一都减一
  3. 如果记录总数为奇数,最后一条记录的id不需要改变

解法一:自连接

1)第一步,先查询出记录的总数

select count(*) counts
from seat;
| counts |
| ------ |
| 5      |

2)将查询道的记录连接每条记录中

select *
from seat, (select count(*) counts 
            from seat) seat_counts;
| id | student | counts |
| -- | ------- | ------ |
| 1  | Abbot   | 5      |
| 2  | Doris   | 5      |
| 3  | Emerson | 5      |
| 4  | Green   | 5      |
| 5  | Jeames  | 5      |

3)对上面查询出的结果集使用 case 对 id 进行判断,最后进行应该排序

select (
    case
        when mod(id, 2) != 0 and counts != id then id + 1 -- id为奇数并且不为最后一条记录
        when mod(id, 2) != 0 and counts = id then id -- id为奇数但为最后一条记录
        else id - 1 -- id为偶数
    end) id,
    student
from seat, (select count(*) counts from seat) seat_counts
order by id asc;

备注:上面的case when结果全部可以由if替代

解法二:子查询

解法一通过自连接将将总记录数添加到每一条记录上,然后进行查询,我们也可以不这些写,直接使用最大id数来判断是否是最后一条记录,这种写法可能效率没有那么高,因为每一行都需要去查询表的最大id

注意:不要使用max函数去判断是否是最后一条记录,max聚合函数会将所有结果聚合为一条记录

错误写法:

select (
    case
        when mod(id, 2) != 0 and max(id) != id then id + 1 -- id为奇数并且不为最后一条记录
        when mod(id, 2) != 0 and max(id) = id then id -- id为奇数但为最后一条记录
        else id - 1 -- id为偶数
    end) id,
    student
from seat
order by id asc;

这样只会得到一条记录,因为max是遍历所有结果后

select (
    case
        when mod(id, 2) != 0 and (select max(id) from seat) != id then id + 1 -- id为奇数并且不为最后一条记录
        when mod(id, 2) != 0 and (select max(id) from seat) = id then id -- id为奇数但为最后一条记录
        else id - 1 -- id为偶数
    end) id,
    student
from seat
order by id asc;

解法三:使用窗口函数

select (case
        when mod(id, 2) != 0 and counts != id then id + 1 -- id为奇数并且不为最后一条记录
        when mod(id, 2) != 0 and counts = id then id -- id为奇数但为最后一条记录
        else id - 1 -- id为偶数
       end) id,
       student
from(select *, count(*) over() counts from seat) seat_counts
order by id asc;

电影评分

题目

题目来源:1341.电影评分

【LeetCode高频SQL50题-基础版】打卡第7天:第36~40题_第4张图片

题解

  • 考察知识点countsumunion allmonthyear子查询order bygroup bylimit

分析:这一题的想要写出来比较简单,但是需要一步一步来,我写的这个SQL可能比较长,涉及到的知识点也比较多

主要思路如下所示:

  1. 查询出一个结果,查找评论电影数量最多的用户名
  2. 查询出第二个结果,查找在 February 2020 平均评分最高 的电影名称。如果出现平局,返回字典序较小的电影名称。
  3. 通过union all将两个结果聚合起来

1)查询出第一个结果,查找评论电影数量最多的用户名

select *, count(*) counts
from MovieRating mr left join Users u on mr.user_id = u.user_id
group by mr.user_id
order by counts desc, u.name asc;
| movie_id | user_id | rating | created_at | user_id | name   | counts |
| -------- | ------- | ------ | ---------- | ------- | ------ | ------ |
| 1        | 1       | 3      | 2020-01-12 | 1       | Daniel | 3      |
| 1        | 2       | 4      | 2020-02-11 | 2       | Monica | 3      |
| 1        | 3       | 2      | 2020-02-12 | 3       | Maria  | 2      |
| 1        | 4       | 1      | 2020-01-01 | 4       | James  | 1      |

然后取第一个记录即可

select name results
from (select u.name, count(*) counts
      from MovieRating mr left join Users u on mr.user_id = u.user_id
      group by mr.user_id
      order by counts desc, u.name asc
      limit 1) t1;
| results |
| ------- |
| Daniel  |

2)查询出第二个结果

select m.title, sum(mr.rating)/count(*) average
from Movies m left join MovieRating mr on m.movie_id = mr.movie_id
where month(mr.created_at) = 2
group by m.movie_id
order by average desc, title asc

备注:其实这里的sum(mr.rating)/count(*)可以直接由avg(mr.rating)进行替换

| title    | average |
| -------- | ------- |
| Frozen 2 | 3.5     |
| Joker    | 3.5     |
| Avengers | 3       |

然后取第一条记录即可

select title results
from (select m.title, sum(mr.rating)/count(*) average
      from Movies m left join MovieRating mr on m.movie_id = mr.movie_id
      where month(mr.created_at) = 2 and year(mr.created_at) = 2020
      group by m.movie_id
      order by average desc, title asc
      limit 1) t2;

备注:这里的 month(mr.created_at) = 2 and year(mr.created_at) = 2020可以直接替换为date_formate(created_at, '%Y-%m') = '2020-02'

| results  |
| -------- |
| Frozen 2 |

3)将两个结果集进行合并

select name results
from (select u.name, count(*) counts
      from MovieRating mr left join Users u on mr.user_id = u.user_id
      group by mr.user_id
      order by counts desc, u.name asc
      limit 1) t1
union all
select title results
from (select m.title, sum(mr.rating)/count(*) average
      from Movies m left join MovieRating mr on m.movie_id = mr.movie_id
      where month(mr.created_at) = 2 and year(mr.created_at) = 2020
      group by m.movie_id
      order by average desc, title asc
      limit 1) t2;

注意点

  1. 这里一定要使用union all而不是union,因为当电影名和用户名重叠时,union得到的记录只有一条
  2. 不要被示例数据给干扰了,真实的数据中并不都是2020年的,所以需要添加一个判断,只查询出2020年的
  3. 对于字符串类型的数据,如果使用 order by默认就按照字典进行排序的

这里在提供一种使用窗口函数的解法

SELECT results
FROM (
  SELECT name AS results, RANK() OVER(ORDER BY COUNT(*) DESC, name) AS RANKING
  FROM Users
  INNER JOIN MovieRating USING(user_id)
  GROUP BY user_id
  UNION ALL
  SELECT title AS results, RANK() OVER(ORDER BY AVG(rating) DESC, title) AS RANKING
  FROM MovieRating
  INNER JOIN Movies USING(movie_id)
  WHERE DATE_FORMAT(created_at, '%Y-%m') = '2020-02'
  GROUP BY movie_id
) T
WHERE T.RANKING = 1

餐馆营业额变化增长

题目

题目来源:1321.餐馆营业额变化增长

【LeetCode高频SQL50题-基础版】打卡第7天:第36~40题_第5张图片

题解

  • 考察知识点子查询sumjoingroup byorder by

分析:这题难点在于筛选出前七天的数据,只要将这个点解决了,其实就不难了,其实就是子查询的灵活运用,通过构造出合适的临时表,才能够更方便的操作,主要有以下几步

  1. 通过自连接得到所有当前天前七天的顾客购买情况
  2. 过滤出没有前面不够七天的商品
  3. 分组,从第七天开始,没天商品的购买总价值、已经平均值

方法一:自连接

1)首先我们通过join自连接查询出当前天开始前六天的用户,同时需要排除连续天数小于六天的

select *
from (select distinct visited_on 
      from Customer) t1 
	  join Customer t2 
	  on datediff(t1.visited_on, t2.visited_on) between 0 and 6
where t1.visited_on >= (select min(visited_on) from Customer ) + 6
order by t1.visited_on;

备注:这里的order by只是为了更好查看结果集,最终的结果可以去掉这个order by,没有必要耗费多余的资源去进行一个排序

+------------+-------------+---------+------------+--------+
| visited_on | customer_id | name    | visited_on | amount |
+------------+-------------+---------+------------+--------+
| 2019-01-07 |           1 | Jhon    | 2019-01-01 |    100 |
| 2019-01-07 |           2 | Daniel  | 2019-01-02 |    110 |
| 2019-01-07 |           3 | Jade    | 2019-01-03 |    120 |
| 2019-01-07 |           4 | Khaled  | 2019-01-04 |    130 |
| 2019-01-07 |           5 | Winston | 2019-01-05 |    110 |
| 2019-01-07 |           6 | Elvis   | 2019-01-06 |    140 |
| 2019-01-07 |           7 | Anna    | 2019-01-07 |    150 |
| 2019-01-08 |           2 | Daniel  | 2019-01-02 |    110 |
| 2019-01-08 |           3 | Jade    | 2019-01-03 |    120 |
| 2019-01-08 |           4 | Khaled  | 2019-01-04 |    130 |
| 2019-01-08 |           5 | Winston | 2019-01-05 |    110 |
| 2019-01-08 |           6 | Elvis   | 2019-01-06 |    140 |
| 2019-01-08 |           7 | Anna    | 2019-01-07 |    150 |
| 2019-01-08 |           8 | Maria   | 2019-01-08 |     80 |
| 2019-01-09 |           3 | Jade    | 2019-01-03 |    120 |
| 2019-01-09 |           4 | Khaled  | 2019-01-04 |    130 |
| 2019-01-09 |           5 | Winston | 2019-01-05 |    110 |
| 2019-01-09 |           6 | Elvis   | 2019-01-06 |    140 |
| 2019-01-09 |           7 | Anna    | 2019-01-07 |    150 |
| 2019-01-09 |           8 | Maria   | 2019-01-08 |     80 |
| 2019-01-09 |           9 | Jaze    | 2019-01-09 |    110 |
| 2019-01-10 |           4 | Khaled  | 2019-01-04 |    130 |
| 2019-01-10 |           5 | Winston | 2019-01-05 |    110 |
| 2019-01-10 |           6 | Elvis   | 2019-01-06 |    140 |
| 2019-01-10 |           7 | Anna    | 2019-01-07 |    150 |
| 2019-01-10 |           8 | Maria   | 2019-01-08 |     80 |
| 2019-01-10 |           9 | Jaze    | 2019-01-09 |    110 |
| 2019-01-10 |           1 | Jhon    | 2019-01-10 |    130 |
| 2019-01-10 |           3 | Jade    | 2019-01-10 |    150 |
+------------+-------------+---------+------------+--------+

2)最难想到的是第一步,其实只要得到了上面那张表,我们接下来的操作就会简单很多。我们只需要利用聚合函数对上面的结果进行一个聚合,然后求取平均值即可

select visited_on, 
       sum(amount) amount, 
       round(sum(amount) / 7, 2) average_amount
from(select t1.visited_on, t2.amount
     from (select distinct visited_on 
           from Customer) t1 
	         join Customer t2 
	         on datediff(t1.visited_on, t2.visited_on) between 0 and 6
      where t1.visited_on >= (select min(visited_on) from Customer ) + 6
) t
group by visited_on
order by visited_on asc;

方法二:窗口函数

这里如果使用窗口函数,可能会显得很简单,比那个分组要好理解的多,但是唯一的缺点就是MySQL的版本至少得是8.0

select *, 
     dense_rank() over(order by visited_on) `row_number`,
     sum(amount) over(order by visited_on range interval 6 day preceding) total
from Customer;
| customer_id | name    | visited_on | amount | row_number | total |
| ----------- | ------- | ---------- | ------ | ---------- | ----- |
| 1           | Jhon    | 2019-01-01 | 100    | 1          | 100   |
| 2           | Daniel  | 2019-01-02 | 110    | 2          | 210   |
| 3           | Jade    | 2019-01-03 | 120    | 3          | 330   |
| 4           | Khaled  | 2019-01-04 | 130    | 4          | 460   |
| 5           | Winston | 2019-01-05 | 110    | 5          | 570   |
| 6           | Elvis   | 2019-01-06 | 140    | 6          | 710   |
| 7           | Anna    | 2019-01-07 | 150    | 7          | 860   |
| 8           | Maria   | 2019-01-08 | 80     | 8          | 840   |
| 9           | Jaze    | 2019-01-09 | 110    | 9          | 840   |
| 1           | Jhon    | 2019-01-10 | 130    | 10         | 1000  |
| 3           | Jade    | 2019-01-10 | 150    | 10         | 1000  |
select distinct visited_on, 
	   total amount, 
	   round(total/7, 2) average_amount 
from(select visited_on, 
     dense_rank() over(order by visited_on) `row_number`,
     sum(amount) over(order by visited_on range interval 6 day preceding) total
     from Customer) t 
where `row_number` > 6
order by visited_on asc;

注意:上面这条SQL只能对于连续日期可以通过,如果日期不连续就无法通过,这个题目是有问题的,题目中说

【LeetCode高频SQL50题-基础版】打卡第7天:第36~40题_第6张图片

也就是说每天都有一名顾客,这就说明日期必定是连续的,但是经过提交发现有一些示例数据并不是连续的,也就是说明题目的描述是有问题的!!!

所以我们需要对上面的SQL进行一个调整,既然无法使用时间间隔表达式,我们就可以换一种思路,直接利用datediff函数来实现过滤

select distinct visited_on, 
	   total amount, 
	   round(total/7, 2) average_amount 
from(select visited_on, 
     dense_rank() over(order by visited_on) `row_number`,
     sum(amount) over(order by visited_on range interval 6 day preceding) total
     from Customer) t 
where datediff(visited_on, (select min(visited_on) from Customer)) >= 6
order by visited_on asc;

方法三:通用表达式

分析:略……今天累了,后面补上讲解吧

关于通用表达式可以参考博主的这篇文章:MySQL8新特性通用表达式详解

with t as (select visited_on, sum(amount) amount
        from Customer 
        group by visited_on)
select t1.visited_on, 
      sum(t2.amount) amount,
      round(sum(t2.amount)/7, 2) average_amount
from t t1, t t2
where datediff(t1.visited_on, t2.visited_on) between 0 and 6
group by t1.visited_on
having datediff(visited_on, (select min(visited_on) from Customer)) >= 6
order by visited_on asc

你可能感兴趣的:(#,编程练习,leetcode,mysql)