• React中的任务调度算法详解


    React中的任务池

    React中的Fiber任务都应该知道吧,而且不同的Fiber任务有不同的优先级,React需要先处理优先级高的任务。例如,用户的点击和输入,这些都是高优先级的任务,因为用户的操作肯定希望马上就会有效果,这样才能提升用户体验。而比如animation事件的优先级肯定要低一点。新进来的高优先级任务进去队列后,React需要优先处理。

    为了存储这些任务,React中有两个任务池。

    // Tasks are stored on a min heap
    var taskQueue = [];
    var timerQueue = []; 
    
    • 1
    • 2
    • 3

    taskQueue与timerQueue都是数组,前者存储的是立即要执行的任务,而后者存的则是可以延迟执行的任务。

     var newTask = {id: taskIdCounter++, // 标记任务idcallback, // 回调函数priorityLevel, // 任务优先级startTime, // 任务开始时间,时间点expirationTime, // 过期时间,时间点sortIndex: -1, // 任务排序,取值来自过期时间,因此值越小,优先级越高}; 
    
    • 1

    React中一旦来了新任务,就会先用currentTime记录当前时间(performance.now()或者Date.now()),如果任务有delay参数,那么任务开始执行时间startTime = currentTime + delay;。接下来通过startTime > currentTime如果成立,证明任务是可以延期的,那么任务进入timerQueue,否则进入taskQueue。

    React中的任务调度

    React怎么找到优先级最高的任务呢,以taskQueue为例,它是动态的任务池(任务队列),数据形式上就是一个数组。当然可以根据优先级进行排序,也就是Array.sort,当有新任务入队后,先排序,然后找出优先级最高的任务执行。但是Array.sort的平均时间复杂度是O(nlogn),并不是最好的解决方案。

    taskQueue的newTask中排序用的是sortIndex,这个值取自过期时间expirationTime,也就意味着优先级越高的任务越需要理解执行,那么过期时间就越小,也就是说,优先级越高,过期时间就越小,sortIndex自然就越小。其实,这就是一种优先队列

    优先队列

    优先队列也是一种队列(首先它是一个队列,其次是尾进头出),只不过不同的是,优先队列的出队顺序是按照优先级来的;在有些情况下,可能需要找到元素集合中的最小或者最大元素,可以利用优先队列ADT来完成操作,优先队列ADT是一种数据结构,它支持插入和删除最小值操作(返回并删除最小元素)或删除最大值操作(返回并删除最大元素)。

    如果最小键值元素拥有最高的优先级,那么这种优先队列叫做,升序优先队列(即总是先删除最小的元素)。类似的,如果最大键值元素拥有最高的优先级,那么这种优先队列叫作降序优先队列(即总是先删除最大的元素);由于这两种类型时对称的,所以只需要关注其中一种,如升序优先队列。

    例如:买车票的时候,我们都在排队,优先级是一样的,谁在队伍前面,谁就先买票,但是这时候来了个军人,他的优先级高,直接就排在了队伍的最前面。

    在React中用最小堆(小根堆,小顶堆。。。)来实现这种功能。就是把taskQueue变成最小堆,然后取出对顶任务执行,对taskQueue堆化,维持它依然是一个最小堆的数据结构。往taskQueue插入新任务的时候,也要进行堆化,始终保持它是一个最小堆。

    优先队列和堆的关系

    有些地方称堆为优先队列(不准确),首先它是队列,有队列的特性,也就是“先进先出”。其次这个队列中的元素是有优先级的,优先级高的会排在前面。

    准确来说,堆是实现优先队列的一种方式。当然优先队列还可以用其他方式来实现。

    React中的最小堆

    之前我们说过堆排序是不稳定排序,但taskQueue希望这个过程是稳定的,也就是说,如果有可能两个任务的过期时间一样,那这个时候就要看谁先进入的任务池了,也就是newTask的id的值,每次来了新任务,id都会加1。

    function compare(a, b) {// Compare sort index first, then task id.const diff = a.sortIndex - b.sortIndex;return diff !== 0 ? diff : a.id - b.id;
    } 
    
    • 1
    • 2

    最小堆

    在了解最小堆之前,先来温习一下基础知识。

    二叉树

    是指树中节点的度不大于2的有序树,它是一种最简单且最重要的树。

    满二叉树

    除最后一层无任何子节点外,每一层上的所有结点都有两个子结点的二叉树。

    从图形形态上看,满二叉树外观上是一个三角形。

    如果一个二叉树的层数为K,且结点总数是(2^k) -1 ,则它就是满二叉树。

    满二叉树,是“女儿双全”,非常圆满,所以叫满二叉树。

    完美二叉树

    除去叶子节点, 所有节点的度都是 2。也就是说,所有的节点的度只能是0或2。

    完美二叉树,要么没有孩子,要么儿女双全。

    满二叉树 VS 完美二叉树

    满二叉树的英文原文:A Full Binary Tree (FBT) is a tree in which every node other than the leaves has two children.

    完美二叉树的英文原文:

    A Perfect Binary Tree(PBT) is a tree with all leaf nodes at the same depth. All internal nodes have degree 2.

    国外的所有书籍参考的是最早翻译的关于满二叉树,和完美二叉树的教材,但是最早翻译的文章翻译错了。现在国内的话,我们只能将错就错了(所有人都错,那错的也就是对的了。比如说客。。。)。如果要和外国友人讨论这两个概念,就要注意了哦。

    完全二叉树

    A Complete Binary Tree (CBT) is a binary tree in which every level,except possibly the last, is completely filled, and all nodes are as far left as possible.

    一棵深度为k的有n个结点的二叉树,对树中的结点按从上至下、从左到右的顺序进行编号,如果编号为i(1≤i≤n)的结点与满二叉树中编号为i的结点在二叉树中的位置相同,则这棵二叉树称为完全二叉树。

    • 除了最后一层外, 所有层都完美填充
    • 最后一层所有叶子节点靠左对齐

    堆是一棵完全二叉树。

    堆总是满足下列性质:

    • 堆总是一棵完全二叉树;
    • 堆中某个节点的值总是不大于或不小于其父节点的值;

    还要先认识下大根堆和小根堆,完全二叉树中所有节点均大于(或小于)它的孩子节点,所以这里就分为两种情况,最大堆和最小堆。

    最大堆

    • 如果所有节点**「大于」孩子节点值,那么这个堆叫做「最大堆」**,堆的最大值在根节点。

    最小堆

    • 如果所有节点**「小于」孩子节点值,那么这个堆叫做「最小堆」**,堆的最小值在根节点。

    堆通常是一个可以被看做一棵 完全二叉树 的数组对象。 当然,二叉树也可以用数组表示。

    堆的实现

    核心思想是,先建堆,后调整。

    创建堆

    对于二叉树(数组表示),我们从下往上进行调整,从**「第一个非叶子节点」**开始向前调整,对于调整的规则如下:

    建堆是一个O(n)的时间复杂度过程。

    ①从第一个非叶子节点开始判断交换下移(shiftDown),使得当前节点和子孩子能够保持堆的性质

    ②但是普通节点替换可能没问题,对如果交换打破子孩子堆结构性质,那么就要重新下移(shiftDown)被交换的节点一直到停止。

    调整堆

    堆构造完成,取第一个堆顶元素为最小(最大),剩下左右孩子依然满足堆的性值,但是缺个堆顶元素,如果给孩子调上来,可能会调动太多并且可能破坏堆结构。

    ① 所以索性把最后一个元素放到第一位。这样只需要判断交换下移(shiftDown),不过需要注意此时整个堆的大小已经发生了变化,我们在逻辑上不会使用被抛弃的位置,所以在设计函数的时候需要附带一个堆大小的参数。

    ② 重复以上操作,一直堆中所有元素都被取得停止。

    而堆算法复杂度的分析上,之前建堆时间复杂度是O(n)。而每次删除堆顶然后需要向下交换,每个个数为logn个。这样复杂度就为O(nlogn),总的时间复杂度为O(n)+O(nlogn)=O(nlogn)。

    堆的应用场景

    堆适合维护集合的最值。

    堆pop出一个元素后,再次调整获取堆顶元素(也就是第二个最值)的花销比较低,因为pop出元素后,堆是一个半成品,在一个半成品上获取第二个最值的cost当然比较低,时间复杂度为O(logn),但如果遍历一遍找到第二个最值的话,时间复杂度为O(n)。

    代码实现

    代码采用Javascript ES6的写法。

    代码

    class Heap {constructor(data, comp) { this.data = data ? data : [];
      // 比较规则:更加灵活,可以比较数值,也可以比较对象 this.compartor = comp ? comp : (a-b) => a-b;
      // 调整为堆(优先队列) this.heapify();}
     heapify() { if(this.size() <= 1) return;  // 从第一个非叶子节点开始调整,也可以从最后一个元素开始调整 for(let i=Math.floor((this.size()-2)/2); i>=0; i--) {// 调整堆, 向下调整也可以用递归来实现,这里用迭代来实现this.shiftDown(i); }}
     // 向下调整shiftDown(i) { let left = 2*i +1; let right = 2*i +2;
      let len = this.size(); while(i < len) {let findIndex = i;// 左孩子更“大”if(left < len && this.compartor(this.data[left], this.data[findIndex]) < 0) { findIndex = left;}// 右孩子更“大”if(right < len && this.compartor(this.data[right], this.data[findIndex]) < 0) { findIndex = right;}
     if(i !== findIndex) {// 当前节点和更“大”的值进行交换 [this.data[i], this.data[findIndex]] = [this.data[findIndex], this.data[i]];
      // 调整完本层,可能会影响下层的堆的特性,所以要继续调整下层(迭代实现,也可以递归) i = findIndex; left = 2*i +1; right = 2*i +2;}else {// 如果无需调整,则跳出(必须跳出,否则循环无法结束) break;} }}
     // 向上调整shiftUp(i){ // 找到parent的下标 let parentIndex = Math.floor((i-1)/2);
      // 最高调整到0 while(parentIndex >=0 ) {let findIndex = i;if(this.compartor(this.data[parentIndex], this.data[findIndex]) > 0) { findIndex = parentIndex;}
     if(findIndex !== i) { [this.data[i], this.data[findIndex]] = [this.data[findIndex], this.data[i]]; i = findIndex; parentIndex = Math.floor((i-1)/2);}else {break;} }}
     // 获取堆中所有元素的个数size(){return this.data.length;}
     // 获取堆首部元素peek(){if(!this.size()) return null;
     return this.data[0];}
     // 往堆中添加一个元素push(x){ this.data.push(x);  this.shiftUp(this.data.length-1);}
     // 从堆里弹出堆首元素pop(){if(!this.size()) return null;
     let res = this.data[0];
     if(this.size() == 1) { this.data.pop();}else {this.data[0] = this.data[this.data.length-1];this.data.length = this.data.length-1;this.shiftDown(0);}
     return res;}
     } 
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20

    测试

     let arr = [2,9,8,6,3,10,5,7,4,1];
     let comp = (a, b) => a-b;
     let heap = new Heap(arr, comp);
     
     let res = [];
     while(heap.size()) {res.push(heap.pop());
     }
    
     console.log(res); 
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9

    arr里的元素也可以是一个对象。

    React源码部分

    React源码中的目录packages/scheduler,就是React的任务调度模块相关的代码。

    github.com/facebook/re…

    github.com/facebook/re…

    /**
     * Copyright (c) Facebook, Inc. and its affiliates.
     *
     * This source code is licensed under the MIT license found in the
     * LICENSE file in the root directory of this source tree.
     *
     * @flow strict
     */
    
    type Heap = Array;
    type Node = {|id: number,sortIndex: number,
    |};
    
    export function push(heap: Heap, node: Node): void {const index = heap.length;heap.push(node);siftUp(heap, node, index);
    }
    
    export function peek(heap: Heap): Node | null {const first = heap[0];return first === undefined ? null : first;
    }
    
    export function pop(heap: Heap): Node | null {const first = heap[0];if (first !== undefined) {const last = heap.pop();if (last !== first) {heap[0] = last;siftDown(heap, last, 0);}return first;} else {return null;}
    }
    
    function siftUp(heap, node, i) {let index = i;while (true) {const parentIndex = (index - 1) >>> 1;const parent = heap[parentIndex];if (parent !== undefined && compare(parent, node) > 0) {// The parent is larger. Swap positions.heap[parentIndex] = node;heap[index] = parent;index = parentIndex;} else {// The parent is smaller. Exit.return;}}
    }
    
    function siftDown(heap, node, i) {let index = i;const length = heap.length;while (index < length) {const leftIndex = (index + 1) * 2 - 1;const left = heap[leftIndex];const rightIndex = leftIndex + 1;const right = heap[rightIndex];// If the left or right node is smaller, swap with the smaller of those.if (left !== undefined && compare(left, node) < 0) {if (right !== undefined && compare(right, left) < 0) {heap[index] = right;heap[rightIndex] = node;index = rightIndex;} else {heap[index] = left;heap[leftIndex] = node;index = leftIndex;}} else if (right !== undefined && compare(right, node) < 0) {heap[index] = right;heap[rightIndex] = node;index = rightIndex;} else {// Neither child is smaller. Exit.return;}}
    }
    
    function compare(a, b) {// Compare sort index first, then task id.const diff = a.sortIndex - b.sortIndex;return diff !== 0 ? diff : a.id - b.id;
    } 
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22
    • 23
    • 24
    • 25
    • 26
    • 27
    • 28
    • 29
    • 30

    我们自己实现的最小堆和React中的实现略有不同,但是思路是一样的,只是代码写法不同而已。

    总结

    React中的任务调度是用最小堆来实现的,如果我们之前就对最小堆有一定了解,那在学习这块内容的时候就会更快一点。个人认为,前期知识积累是多么重要啊,但是这个过程可能会比较枯燥。 这个时候,是不是觉得自己也会一些算法了,其实这些算法是入门级别的,甚至还没有入门。因为在React的任务调度场景中,要实现的需求是非常明确的,而且要采用什么样的数据结构和算法也是明确的。在实际的一些场景中,我们知道了具体的需求,但是并不知道用什么数据结果和算法,就需要把需求抽象一下,根据抽象的数据模型来设计具体的数据结构和算法,这些才是重点。

  • 相关阅读:
    一到汇报思绪乱? 学会这4个模型,高效表达无废话
    【动画进阶】巧用 CSS/SVG 实现复杂线条光效动画
    力扣70. 爬楼梯
    PreScan快速入门到精通第二十二讲驾驶员模型之路径跟踪
    01-Maven入门
    C++ 11新特性之std::function类模板与std::bind绑定器介绍
    文章翻译软件-批量免费翻译软件支持各大翻译接口
    论文解读:SlowFast Networks for Video Recognition
    字符串4:反转字符串中的单词
    Matlab高效编程:向量化(vectorization)、矩阵化、变量预定义
  • 原文地址:https://blog.csdn.net/web2022050902/article/details/126370820