LeetCode 630. Course Schedule III【反悔贪心,堆,排序】中等

本文属于「征服LeetCode」系列文章之一,这一系列正式开始于2021/08/12。由于LeetCode上部分题目有锁,本系列将至少持续到刷完所有无锁题之日为止;由于LeetCode还在不断地创建新题,本系列的终止日期可能是永远。在这一系列刷题文章中,我不仅会讲解多种解题思路及其优化,还会用多种编程语言实现题解,涉及到通用解法时更将归纳总结出相应的算法模板。

为了方便在PC上运行调试、分享代码文件,我还建立了相关的仓库。在这一仓库中,你不仅可以看到LeetCode原题链接、题解代码、题解文章链接、同类题目归纳、通用解法总结等,还可以看到原题出现频率和相关企业等重要信息。如果有其他优选题解,还可以一同分享给他人。

由于本系列文章的内容随时可能发生更新变动,欢迎关注和收藏征服LeetCode系列文章目录一文以作备忘。

这里有 n 门不同的在线课程,按从 1 到 n 编号。给你一个数组 courses ,其中 courses[i] = [durationi, lastDayi] 表示第 i 门课将会 持续 上 durationi 天课,并且必须在不晚于 lastDayi 的时候完成。

你的学期从第 1 天开始。且不能同时修读两门及两门以上的课程。

返回你最多可以修读的课程数目。

示例 1:

输入:courses = [[100, 200], [200, 1300], [1000, 1250], [2000, 3200]]
输出:3
解释:
这里一共有 4 门课程,但是你最多可以修 3 门:
首先,修第 1 门课,耗费 100 天,在第 100 天完成,在第 101 天开始下门课。
第二,修第 3 门课,耗费 1000 天,在第 1100 天完成,在第 1101 天开始下门课程。
第三,修第 2 门课,耗时 200 天,在第 1300 天完成。
第 4 门课现在不能修,因为将会在第 3300 天完成它,这已经超出了关闭日期。

示例 2:

输入:courses = [[1,2]]
输出:1

示例 3:

输入:courses = [[3,2],[4,3]]
输出:0

提示:

  • 1 <= courses.length <= 10^4
  • 1 <= durationi, lastDayi <= 10^4

这个题和他左右两个邻居来自同一场周赛,而且这道题只是第二题…… 当时美服共有超过2000人参赛,除了前112名,都是一题选手……

解法 反悔贪心+堆

思路

这道题很有意义,是一道经典贪心运用题——题目要求我们构造一种可行的课程排列,排列中每门课程的实际结束时间「不超过最晚截止时间 lastDayi」,求最长可行排列的长度。

对于两门课 ( t 1 , d 1 ) (t_1, d_1) (t1,d1) ( t 2 , d 2 ) (t_2, d_2) (t2,d2) ,如果后者的关闭时间较晚,即 d 1 ≤ d 2 d_1 \leq d_2 d1d2 ,那么我们先学习前者,再学习后者,总是最优的。这是因为:

  • 设开始学习的时间点为 x x x 。如果先学习前者,再学习后者,那么需要满足:
    { x + t 1 ≤ d 1 x + t 1 + t 2 ≤ d 2 \begin{cases} x + t_1 \leq d_1 \\ x + t_1 + t_2 \leq d_2 \end{cases} {x+t1d1x+t1+t2d2
  • 如果先学习后者,再学习前者,那么需要满足:
    { x + t 2 ≤ d 2 x + t 2 + t 1 ≤ d 1 \begin{cases} x + t_2 \leq d_2 \\ x + t_2 + t_1 \leq d_1 \end{cases} {x+t2d2x+t2+t1d1
    如果 x + t 2 + t 1 ≤ d 1 x + t_2 + t_1 \leq d_1 x+t2+t1d1 成立,由于 d 1 ≤ d 2 d_1 \leq d_2 d1d2 ,那么 x + t 1 ≤ d 1 x + t_1 \leq d_1 x+t1d1 x + t 1 + t 2 ≤ d 2 x + t_1 + t_2 \leq d_2 x+t1+t2d2 同时成立。这说明如果能「先学习后者,再学习前者」那么一定能「先学习前者,再学习后者」。反之如果 x + t 1 + t 2 ≤ d 2 x + t_1 + t_2 \leq d_2 x+t1+t2d2 成立,则不能推出 x + t 2 + t 1 ≤ d 1 x + t_2 + t_1 \leq d_1 x+t2+t1d1 成立,例如当 x = 0 x = 0 x=0 ( t 1 , d 1 ) = ( 2 , 3 ) (t_1, d_1) = (2, 3) (t1,d1)=(2,3) ( t 2 , d 2 ) = ( 5 , 100 ) (t_2, d_2) = (5, 100) (t2,d2)=(5,100) 时,虽然能「先学习前者,再学习后者」,但不能「先学习后者,再学习前者」。

因此,我们可以将所有的课程按照关闭时间 d d d 进行升序排序,再依次挑选课程并按照顺序进行学习。

在遍历的过程中,假设我们当前遍历到了第 i i i 门课 ( t i , d i ) (t_i, d_i) (ti,di) ,而在前 i − 1 i-1 i1 门课程中我们选择了 k k k 门课 ( t x 1 , d x 1 ) , ( t x 2 , d x 2 ) , ⋯   , ( t x k , d x k ) (t_{x_1}, d_{x_1}), (t_{x_2}, d_{x_2}), \cdots, (t_{x_k}, d_{x_k}) (tx1,dx1),(tx2,dx2),,(txk,dxk) ,满足 x 1 < x 2 < ⋯ < x k x_1 < x_2 < \cdots < x_k x1<x2<<xk ,那么有:
{ t x 1 ≤ d x 1 t x 1 + t x 2 ≤ d x 2 ⋯ t x 1 + t x 2 + ⋯ + t x k ≤ d x k \begin{cases} t_{x_1} \leq d_{x_1} \\ t_{x_1} + t_{x_2} \leq d_{x_2} \\ \cdots \\ t_{x_1} + t_{x_2} + \cdots + t_{x_k} \leq d_{x_k} \end{cases} tx1dx1tx1+tx2dx2tx1+tx2++txkdxk

如果上述选择方案是前 i − 1 i-1 i1 门课程的「最优方案」:即不存在能选择 k + 1 k+1 k+1 门课程的方法,也不存在能选择 k k k 门课程,并且总时长更短(小于 t x 1 + t x 2 + ⋯ + t x k t_{x_1} + t_{x_2} + \cdots + t_{x_k} tx1+tx2++txk )的方案,那么我们可以基于该方案与第 i i i 门课程 ( t i , d i ) (t_i, d_i) (ti,di) ,构造出前 i i i 门课程的最优方案

  • 如果 t x 1 + t x 2 + ⋯ + t x k + t i ≤ d i t_{x_1} + t_{x_2} + \cdots + t_{x_k} + t_i \leq d_i tx1+tx2++txk+tidi ,那么我们可以将第 i i i 门课程 ( t i , d i ) (t_i, d_i) (ti,di) 直接加入方案,得到选择 k + 1 k+1 k+1 门课程的最优方案
    此处的「最优性」可以使用反证法来证明—— 如果存在更优的方案,那么该方案一定包含 ( t i , d i ) (t_i, d_i) (ti,di) ,如果不包含,那么说明前 i − 1 i-1 i1 门课程就存在更优的方案,这与我们的假设相矛盾。
    当最优方案包含 ( t i , d i ) (t_i, d_i) (ti,di) 时,根据之前的证明,「先学习前者,再学习后者」总是最优的,我们就可以把 ( t i , d i ) (t_i, d_i) (ti,di) 作为该方案的最后一门课程。由于该最优方案优于选择 x 1 , x 2 , ⋯   , x k , i x_1, x_2, \cdots, x_k, i x1,x2,,xk,i 的构造方案,因此同时将最后一门课程 i i i 去除后,该方案仍然优于选择 x 1 , x 2 , ⋯   , x k x_1, x_2, \cdots, x_k x1,x2,,xk 的方案,同样说明前 i − 1 i-1 i1 门课程存在更优的方案,这与我们的假设相矛盾。
  • 如果 t x 1 + t x 2 + ⋯ + t x k + t i > d i t_{x_1} + t_{x_2} + \cdots + t_{x_k} + t_i > d_i tx1+tx2++txk+ti>di ​,那么我们无法将第 i i i 门课程 ( t i , d i ) (t_i, d_i) (ti,di) 直接加入方案。我们可以使用类似的反证法,证明出此时前 i i i 门课程不可能存在选择 k + 1 k+1 k+1 门课程的更优方案,因此我们的目标仍然为选择 k k k 门课程,但最小化它们的总时间,为后续的课程腾出更多的时间
    • 如果 t x 1 , t x 2 , ⋯   , t x k t_{x_1}, t_{x_2}, \cdots, t_{x_k} tx1,tx2,,txk 都小于等于 t i t_i ti ,那么我们显然没有办法通过第 i i i 门课来使得总时间更小。但如果其中时间最长的那门课(记为 t x j t_{x_j} txj 满足 t x j > t i t_{x_j} > t_i txj>ti ,那么我们就可以尝试将第 x j x_j xj 门课程替换成第 i i i 门课程了。这样的替换会使得总时间减少 t x j − t i t_{x_j} - t_i txjti ​,也是我们能做到的减少的上限了
      那么将第 x j x_j xj 门课程替换成第 i i i 门课程后,这些课程是否满足题目的要求呢?我们将这些课程按照 x 1 , x 2 , ⋯   , x j − 1 , x j + 1 , ⋯   , x k , i x_1, x_2, \cdots, x_{j-1}, x_{j+1}, \cdots, x_k, i x1,x2,,xj1,xj+1,,xk,i 的顺序进行学习:
      • 对于 x 1 , x 2 , ⋯   , x j − 1 x_1, x_2, \cdots, x_{j-1} x1,x2,,xj1 ,它们需要满足的不等式与之前是一致的,因此仍然满足要求;
      • 对于 x j + 1 , ⋯   , x k x_{j+1}, \cdots, x_{k} xj+1,,xk ,原先需要满足的不等式的左侧少了 t x j t_{x_j} txj 这一项,由于是左侧 ≤ ≤ 右侧,因此仍然满足要求;
      • 对于 i i i,由于 t x 1 + t x 2 + ⋯ + t x k ≤ d x k t_{x_1} + t_{x_2} + \cdots + t_{x_k} \leq d_{x_k} tx1+tx2++txkdxk 成立,而 t x j > t i t_{x_{j}} > t_i txj>ti ,因此:
        t x 1 + t x 2 + ⋯ + t x j − 1 + t x j + 1 + ⋯ + t x k + t i ≤ d x k t_{x_1} + t_{x_2} + \cdots + t_{x_{j-1}} + t_{x_{j+1}} + \cdots + t_{x_k} + t_i \leq d_{x_k} tx1+tx2++txj1+txj+1++txk+tidxk
        满足要求。

这就说明我们可以将第 x j x_j xj 门课程替换成第 i i i 门课程。这样一来,当我们遍历完所有的 n n n 门课程后,就可以得到最终的答案。

算法

我们需要一个数据结构支持「取出 t t t 值最大的那门课程」,因此我们可以使用优先队列(大根堆)。我们依次遍历每一门课程,当遍历到 ( t i , d i ) (t_i, d_i) (ti,di) 时:

  • 如果当前优先队列中所有课程的总时间与 t i t_i ti 之和小于等于 d i d_i di ,那么我们就把 t i t_i ti 加入优先队列中;
  • 如果当前优先队列中所有课程的总时间与 t i t_i ti​ 之和大于 d i d_i di ,那么我们找到优先队列中的最大元素 t x j t_{x_j} txj 。如果 t x j > t i t_{x_j} > t_i txj>ti ,则将它移出优先队列,并把 t i t_i ti​ 加入优先队列中。

在遍历完成后,优先队列中包含的元素个数即为答案。

class Solution {
public:
    int scheduleCourse(vector<vector<int>>& courses) {
        sort(courses.begin(), courses.end(), [](const auto &c0, const auto &c1) {
            return c0[1] < c1[1];
        });
        priority_queue<int> q;
        // 优先队列中所有课程的总时间
        int total = 0;
        for (const auto &course : courses) {
            int ti = course[0], di = course[1];
            if (total + ti <= di) {
                total += ti;
                q.push(ti);
            } else if (!q.empty() && q.top() > ti) {
                total -= q.top() - ti;
                q.pop();
                q.push(ti);
            }
        }
        return q.size();
    }
};

复杂度分析:

  • 时间复杂度: O ( n log ⁡ n ) O(n\log n) O(nlogn) 。排序需要 O ( n log ⁡ n ) O(n\log n) O(nlogn) 的时间,优先队列的单次操作需要 O ( log ⁡ n ) O(\log n) O(logn) 的时间,每个任务会最多被放入和取出优先队列一次,这一部分的时间复杂度为 O ( n log ⁡ n ) O(n\log n) O(nlogn) 。因此总时间复杂度也为 O ( n log ⁡ n ) O(n\log n) O(nlogn)
  • 空间复杂度: O ( n ) O(n) O(n) ,即为优先队列需要使用的空间。

你可能感兴趣的:(贪心,优先队列-二叉堆,leetcode,linux,算法)