• LeetCode 630. Course Schedule III【反悔贪心,堆,排序】中等


    本文属于「征服LeetCode」系列文章之一,这一系列正式开始于2021/08/12。由于LeetCode上部分题目有锁,本系列将至少持续到刷完所有无锁题之日为止;由于LeetCode还在不断地创建新题,本系列的终止日期可能是永远。在这一系列刷题文章中,我不仅会讲解多种解题思路及其优化,还会用多种编程语言实现题解,涉及到通用解法时更将归纳总结出相应的算法模板。

    为了方便在PC上运行调试、分享代码文件,我还建立了相关的仓库。在这一仓库中,你不仅可以看到LeetCode原题链接、题解代码、题解文章链接、同类题目归纳、通用解法总结等,还可以看到原题出现频率和相关企业等重要信息。如果有其他优选题解,还可以一同分享给他人。

    由于本系列文章的内容随时可能发生更新变动,欢迎关注和收藏征服LeetCode系列文章目录一文以作备忘。

    这里有 n 门不同的在线课程,按从 1 到 n 编号。给你一个数组 courses ,其中 courses[i] = [durationi, lastDayi] 表示第 i 门课将会 持续 上 durationi 天课,并且必须在不晚于 lastDayi 的时候完成。

    你的学期从第 1 天开始。且不能同时修读两门及两门以上的课程。

    返回你最多可以修读的课程数目。

    示例 1:

    输入:courses = [[100, 200], [200, 1300], [1000, 1250], [2000, 3200]]
    输出:3
    解释:
    这里一共有 4 门课程,但是你最多可以修 3 门:
    首先,修第 1 门课,耗费 100 天,在第 100 天完成,在第 101 天开始下门课。
    第二,修第 3 门课,耗费 1000 天,在第 1100 天完成,在第 1101 天开始下门课程。
    第三,修第 2 门课,耗时 200 天,在第 1300 天完成。
    第 4 门课现在不能修,因为将会在第 3300 天完成它,这已经超出了关闭日期。
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8

    示例 2:

    输入:courses = [[1,2]]
    输出:1
    
    • 1
    • 2

    示例 3:

    输入:courses = [[3,2],[4,3]]
    输出:0
    
    • 1
    • 2

    提示:

    • 1 <= courses.length <= 10^4
    • 1 <= durationi, lastDayi <= 10^4

    这个题和他左右两个邻居来自同一场周赛,而且这道题只是第二题…… 当时美服共有超过2000人参赛,除了前112名,都是一题选手……

    解法 反悔贪心+堆

    思路

    这道题很有意义,是一道经典贪心运用题——题目要求我们构造一种可行的课程排列,排列中每门课程的实际结束时间「不超过最晚截止时间 lastDayi」,求最长可行排列的长度。

    对于两门课 ( t 1 , d 1 ) (t_1, d_1) (t1,d1) ( t 2 , d 2 ) (t_2, d_2) (t2,d2) ,如果后者的关闭时间较晚,即 d 1 ≤ d 2 d_1 \leq d_2 d1d2 ,那么我们先学习前者,再学习后者,总是最优的。这是因为:

    • 设开始学习的时间点为 x x x 。如果先学习前者,再学习后者,那么需要满足:
      { x + t 1 ≤ d 1 x + t 1 + t 2 ≤ d 2 {x+t1d1x+t1+t2d2
      {x+t1d1x+t1+t2d2
    • 如果先学习后者,再学习前者,那么需要满足:
      { x + t 2 ≤ d 2 x + t 2 + t 1 ≤ d 1 {x+t2d2x+t2+t1d1
      {x+t2d2x+t2+t1d1

      如果 x + t 2 + t 1 ≤ d 1 x + t_2 + t_1 \leq d_1 x+t2+t1d1 成立,由于 d 1 ≤ d 2 d_1 \leq d_2 d1d2 ,那么 x + t 1 ≤ d 1 x + t_1 \leq d_1 x+t1d1 x + t 1 + t 2 ≤ d 2 x + t_1 + t_2 \leq d_2 x+t1+t2d2 同时成立。这说明如果能「先学习后者,再学习前者」那么一定能「先学习前者,再学习后者」。反之如果 x + t 1 + t 2 ≤ d 2 x + t_1 + t_2 \leq d_2 x+t1+t2d2 成立,则不能推出 x + t 2 + t 1 ≤ d 1 x + t_2 + t_1 \leq d_1 x+t2+t1d1 成立,例如当 x = 0 x = 0 x=0 ( t 1 , d 1 ) = ( 2 , 3 ) (t_1, d_1) = (2, 3) (t1,d1)=(2,3) ( t 2 , d 2 ) = ( 5 , 100 ) (t_2, d_2) = (5, 100) (t2,d2)=(5,100) 时,虽然能「先学习前者,再学习后者」,但不能「先学习后者,再学习前者」。

    因此,我们可以将所有的课程按照关闭时间 d d d 进行升序排序,再依次挑选课程并按照顺序进行学习。

    在遍历的过程中,假设我们当前遍历到了第 i i i 门课 ( t i , d i ) (t_i, d_i) (ti,di) ,而在前 i − 1 i-1 i1 门课程中我们选择了 k k k 门课 ( t x 1 , d x 1 ) , ( t x 2 , d x 2 ) , ⋯   , ( t x k , d x k ) (t_{x_1}, d_{x_1}), (t_{x_2}, d_{x_2}), \cdots, (t_{x_k}, d_{x_k}) (tx1,dx1),(tx2,dx2),,(txk,dxk) ,满足 x 1 < x 2 < ⋯ < x k x_1 < x_2 < \cdots < x_k x1<x2<<xk ,那么有:
    { t x 1 ≤ d x 1 t x 1 + t x 2 ≤ d x 2 ⋯ t x 1 + t x 2 + ⋯ + t x k ≤ d x k {tx1dx1tx1+tx2dx2tx1+tx2++txkdxk

    tx1dx1tx1+tx2dx2tx1+tx2++txkdxk

    如果上述选择方案是前 i − 1 i-1 i1 门课程的「最优方案」:即不存在能选择 k + 1 k+1 k+1 门课程的方法,也不存在能选择 k k k 门课程,并且总时长更短(小于 t x 1 + t x 2 + ⋯ + t x k t_{x_1} + t_{x_2} + \cdots + t_{x_k} tx1+tx2++txk )的方案,那么我们可以基于该方案与第 i i i 门课程 ( t i , d i ) (t_i, d_i) (ti,di) ,构造出前 i i i 门课程的最优方案

    • 如果 t x 1 + t x 2 + ⋯ + t x k + t i ≤ d i t_{x_1} + t_{x_2} + \cdots + t_{x_k} + t_i \leq d_i tx1+tx2++txk+tidi ,那么我们可以将第 i i i 门课程 ( t i , d i ) (t_i, d_i) (ti,di) 直接加入方案,得到选择 k + 1 k+1 k+1 门课程的最优方案
      此处的「最优性」可以使用反证法来证明—— 如果存在更优的方案,那么该方案一定包含 ( t i , d i ) (t_i, d_i) (ti,di) ,如果不包含,那么说明前 i − 1 i-1 i1 门课程就存在更优的方案,这与我们的假设相矛盾。
      当最优方案包含 ( t i , d i ) (t_i, d_i) (ti,di) 时,根据之前的证明,「先学习前者,再学习后者」总是最优的,我们就可以把 ( t i , d i ) (t_i, d_i) (ti,di) 作为该方案的最后一门课程。由于该最优方案优于选择 x 1 , x 2 , ⋯   , x k , i x_1, x_2, \cdots, x_k, i x1,x2,,xk,i 的构造方案,因此同时将最后一门课程 i i i 去除后,该方案仍然优于选择 x 1 , x 2 , ⋯   , x k x_1, x_2, \cdots, x_k x1,x2,,xk 的方案,同样说明前 i − 1 i-1 i1 门课程存在更优的方案,这与我们的假设相矛盾。
    • 如果 t x 1 + t x 2 + ⋯ + t x k + t i > d i t_{x_1} + t_{x_2} + \cdots + t_{x_k} + t_i > d_i tx1+tx2++txk+ti>di ​,那么我们无法将第 i i i 门课程 ( t i , d i ) (t_i, d_i) (ti,di) 直接加入方案。我们可以使用类似的反证法,证明出此时前 i i i 门课程不可能存在选择 k + 1 k+1 k+1 门课程的更优方案,因此我们的目标仍然为选择 k k k 门课程,但最小化它们的总时间,为后续的课程腾出更多的时间
      • 如果 t x 1 , t x 2 , ⋯   , t x k t_{x_1}, t_{x_2}, \cdots, t_{x_k} tx1,tx2,,txk 都小于等于 t i t_i ti ,那么我们显然没有办法通过第 i i i 门课来使得总时间更小。但如果其中时间最长的那门课(记为 t x j t_{x_j} txj 满足 t x j > t i t_{x_j} > t_i txj>ti ,那么我们就可以尝试将第 x j x_j xj 门课程替换成第 i i i 门课程了。这样的替换会使得总时间减少 t x j − t i t_{x_j} - t_i txjti ​,也是我们能做到的减少的上限了
        那么将第 x j x_j xj 门课程替换成第 i i i 门课程后,这些课程是否满足题目的要求呢?我们将这些课程按照 x 1 , x 2 , ⋯   , x j − 1 , x j + 1 , ⋯   , x k , i x_1, x_2, \cdots, x_{j-1}, x_{j+1}, \cdots, x_k, i x1,x2,,xj1,xj+1,,xk,i 的顺序进行学习:
        • 对于 x 1 , x 2 , ⋯   , x j − 1 x_1, x_2, \cdots, x_{j-1} x1,x2,,xj1 ,它们需要满足的不等式与之前是一致的,因此仍然满足要求;
        • 对于 x j + 1 , ⋯   , x k x_{j+1}, \cdots, x_{k} xj+1,,xk ,原先需要满足的不等式的左侧少了 t x j t_{x_j} txj 这一项,由于是左侧 ≤ ≤ 右侧,因此仍然满足要求;
        • 对于 i i i,由于 t x 1 + t x 2 + ⋯ + t x k ≤ d x k t_{x_1} + t_{x_2} + \cdots + t_{x_k} \leq d_{x_k} tx1+tx2++txkdxk 成立,而 t x j > t i t_{x_{j}} > t_i txj>ti ,因此:
          t x 1 + t x 2 + ⋯ + t x j − 1 + t x j + 1 + ⋯ + t x k + t i ≤ d x k t_{x_1} + t_{x_2} + \cdots + t_{x_{j-1}} + t_{x_{j+1}} + \cdots + t_{x_k} + t_i \leq d_{x_k} tx1+tx2++txj1+txj+1++txk+tidxk
          满足要求。

    这就说明我们可以将第 x j x_j xj 门课程替换成第 i i i 门课程。这样一来,当我们遍历完所有的 n n n 门课程后,就可以得到最终的答案。

    算法

    我们需要一个数据结构支持「取出 t t t 值最大的那门课程」,因此我们可以使用优先队列(大根堆)。我们依次遍历每一门课程,当遍历到 ( t i , d i ) (t_i, d_i) (ti,di) 时:

    • 如果当前优先队列中所有课程的总时间与 t i t_i ti 之和小于等于 d i d_i di ,那么我们就把 t i t_i ti 加入优先队列中;
    • 如果当前优先队列中所有课程的总时间与 t i t_i ti​ 之和大于 d i d_i di ,那么我们找到优先队列中的最大元素 t x j t_{x_j} txj 。如果 t x j > t i t_{x_j} > t_i txj>ti ,则将它移出优先队列,并把 t i t_i ti​ 加入优先队列中。

    在遍历完成后,优先队列中包含的元素个数即为答案。

    class Solution {
    public:
        int scheduleCourse(vector<vector<int>>& courses) {
            sort(courses.begin(), courses.end(), [](const auto &c0, const auto &c1) {
                return c0[1] < c1[1];
            });
            priority_queue<int> q;
            // 优先队列中所有课程的总时间
            int total = 0;
            for (const auto &course : courses) {
                int ti = course[0], di = course[1];
                if (total + ti <= di) {
                    total += ti;
                    q.push(ti);
                } else if (!q.empty() && q.top() > ti) {
                    total -= q.top() - ti;
                    q.pop();
                    q.push(ti);
                }
            }
            return q.size();
        }
    };
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22
    • 23

    复杂度分析:

    • 时间复杂度: O ( n log ⁡ n ) O(n\log n) O(nlogn) 。排序需要 O ( n log ⁡ n ) O(n\log n) O(nlogn) 的时间,优先队列的单次操作需要 O ( log ⁡ n ) O(\log n) O(logn) 的时间,每个任务会最多被放入和取出优先队列一次,这一部分的时间复杂度为 O ( n log ⁡ n ) O(n\log n) O(nlogn) 。因此总时间复杂度也为 O ( n log ⁡ n ) O(n\log n) O(nlogn)
    • 空间复杂度: O ( n ) O(n) O(n) ,即为优先队列需要使用的空间。
  • 相关阅读:
    MySQL 快速入门之第四章 常用函数
    工序解释执行程序--工程师的成长
    蓝桥杯打卡Day6
    嵌入式Ubuntu根文件系统移植带桌面
    Linux初识
    循环神经网络时间序列预测
    Unity编辑器扩展 UI控件篇
    【保姆级教程】ChatGPT/GPT4科研技术应用与AI绘图
    JS-String篇(速记用法大汇总)
    Elasticsearch: Field Type
  • 原文地址:https://blog.csdn.net/myRealization/article/details/132789631