数据分析 || LeetCode SQL 刷题日记
硕士在读数据分析小小白一枚,记录自己学习进步的点点滴滴~希望可以坚持下去!拿到理想Offer!数据人冲冲冲!!!
(刷题顺序随机)
编写一个 SQL 查询,满足条件:无论 person 是否有地址信息,都需要基于上述两表提供 person 的以下信息:
FirstName, LastName, City, State
考察JOIN用法(LEFT JOIN)*
代码
SELECT FirstName, LastName, City, state
FROM Person LEFT JOIN Address
ON Person.PersonId = Address.PersonId
编写一个 SQL 查询,获取 Employee 表中第二高的薪水(Salary) 。例如上述 Employee 表,SQL查询应该返回 200 作为第二高的薪水。如果不存在第二高的薪水,那么查询应返回 null。
思路
刚拿到有点懵—首先肯定要排序,且要排除重复值(distinct),想办法找出不是最大值的最大值
方法一:综合运用(DISTINCT MAX )
代码
SELECT MAX(Salary) SecondHighestSalary
FROM Employee
WHERE Salary < (SELECT MAX(Salary) FROM Employee)
执行结果
方法二:综合运用(DISTINCT DESC LIMIT)
代码(注意IS NULL ,以及limit的用法及下标)
SELECT DISTINCT(Salary) SecondHighestSalary
FROM Employee
ORDER BY Salary DESC
LIMIT 1,1 ;
编写一个 SQL 查询,获取 Employee 表中第 n 高的薪水(Salary)。
综合运用(DISTINCT LIMIT)
小坑
要排序,且要排除重复值(distinct),利用limit 与下标的关系
LIMIT A,B的用法:A,从第A条数据开始取,取B条数据。下表从0开始!
SELECT DISTINCT Salary
FROM Employee
ORDER BY Salary DESC
LIMIT N-1,1
!!!此代码不可运行,因为LIMIT中的值不可进行运算。
代码
CREATE FUNCTION getNthHighestSalary(N INT) RETURNS INT BEGIN SET N= N-1;
RETURN (
# Write your MySQL query statement below.
SELECT DISTINCT Salary
FROM Employee
ORDER BY Salary DESC
LIMIT N,1 );
END
第二高的薪水:
要想获取第二高,需要排序,使用 order by(默认是升序 asc,即从小到大),若想降序则使用关键字 desc
去重,如果有多个相同的数据,使用关键字 distinct 去重
判断临界输出,如果不存在第二高的薪水,查询应返回 null,使用 ifNull(查询,null)方法
起别名,使用关键字 as …
因为去了重,又按顺序排序,使用 limit()方法,查询第二大的数据,即第二高的薪水,即 limit(1,1) (因为默认从0开始,所以第一个1是查询第二大的数,第二个1是表示往后显示多少条数据,这里只需要一条)
第 N 高的薪水:
题目是 176.第二高的薪水 的变形,将查询第二名变成查询 第N名
别名中不能带参数,一开始看到测试用例表,使用的别名是getNthHighestSalary(2),就用了getNthHighestSalary(N)做别名,一开始报错还不知道是哪,后面删去变量即可
limit()方法中不能参与运算,因为索引从0开始,所以要 - 1,最好在外面就设定好 set N = N - 1
编写一个 SQL 查询来实现分数排名。
如果两个分数相同,则两个分数排名(Rank)相同。请注意,平分后的下一个名次应该是下一个连续的整数值。换句话说,名次之间不应该有“间隔”。
rank() over(order by 列名)
代码
SELECT Score, rank() over(order by Score DESC)'Rank'
from Scores;
常规逻辑代码
SELECT a.Score AS Score, # Rank是关键字,要加引号
count(DISTINCT b.Score) AS 'Rank' # 统计b表符合条件的不重复的分数的数量作为排名
FROM scores a JOIN scores b
WHERE b.Score >= a.Score # 条件是这个分数不小于我,因为a、b表数据相同,所以排名值最小是1
Group by a.id # a表中每个数据都进行排名
ORDER BY a.Score DESC; # 最后按分数(跟排名一样)降序排列
编写一个 SQL 查询,查找所有至少连续出现三次的数字。
返回的结果表中的数据可以按 任意顺序 排列。
大致有思路,但用SQL实现有难度,相当于写函数方法。
**
rank() over(order by 列名)
代码
#小Tips: 几个值都比较的话,就选择联系多个表。
SELECT DISTINCT l1.Num AS ConsecutiveNums
FROM Logs l1
INNER JOIN Logs l2 ON L1.Id = L2.Id+1 AND L1.Num = L2.Num
INNER JOIN Logs L3 ON L1.Id = L3.Id+2 AND L1.Num = L3.Num
Employee 表包含所有员工,他们的经理也属于员工。每个员工都有一个 Id,此外还有一列对应员工的经理的 Id。
代码
SELECT A.NAME Employee
FROM Employee A
LEFT JOIN Employee B ON A.ManagerId=B.Id
where A.Salary>B.Salary
and a.ManagerId is not null