• 计数排序(Counting Sort)


    计数排序(Counting Sort)

    一、基本思想

    计数排序不是基于比较的排序算法,其核心在于将输入的数据值转化为键存储在额外开辟的数组空间中。 作为一种线性时间复杂度的排序,计数排序要求输入的数据必须是有确定范围的整数。它的基本思想是:给定的输入序列中的每一个元素 x x x,确定该序列中值小于等于 x x x 元素的个数,然后将 x x x 直接存放到最终的排序序列的正确位置上。

    二、实现逻辑

    由于用来计数的数组count的长度取决于待排序数组中数据的范围(等于待排序数组的最大值与最小值的差加上1),这使得计数排序对于数据范围很大的数组,需要大量时间和内存。计数排序是用来排序0到100之间的数字的最好的算法,但是它不适合按字母顺序排序人名。

    算法步骤:

    1. 找出待排序的数组种最大和最小的元素;
    2. 统计数组中每个值为 i i i 的元素出现的次数,存入数组count的第 i i i 项;
    3. 对所有的计数累加(从count中的第一个元素开始,每一项和前一项相加),为了直接求得元素的位置;
    4. 反向填充目标数组:将每个元素 i i i 放在新数组的第count[i]项,每放一个元素就将count[i]减去1。

    三、时间复杂度的分析

    遍历数组进行计数操作产生了 Ω ( n ) \Omega(n) Ω(n) O ( n ) O(n) O(n) Θ ( n ) \Theta(n) Θ(n)的时间复杂度,对计数数组进行前缀和操作产生了 Ω ( k ) \Omega(k) Ω(k) O ( k ) O(k) O(k) Θ ( k ) \Theta(k) Θ(k)的时间复杂度,进行反向填充操作同样产生了 Ω ( n ) \Omega(n) Ω(n) O ( n ) O(n) O(n) Θ ( n ) \Theta(n) Θ(n)的时间复杂度。综上所述: Ω ( n + k ) \Omega(n+k) Ω(n+k) O ( n + k ) O(n+k) O(n+k) Θ ( n + k ) \Theta(n+k) Θ(n+k) n n n 前常数可以忽略。

    四、空间复杂度的分析

    由于额外开辟了大小为k = max(array) - min(array) + 1的数组,所以空间复杂度为: O ( k ) O(k) O(k)。在算法实现中开辟了另外一个用于存储记录的列表result

    五、算法实现

    while循环

    def counting_sort(array: List[int], reverse: bool=False) -> None:
        '''
        array: 仅支持全为整数类型的数据。
        reverse: 是否降序, 默认采用升序。
        '''
        if not array:
            return None
        arrmin = min(array)
        arrmax = max(array)
        count = [0] * (arrmax - arrmin + 1)
        for value in array:
            count[value - arrmin] += 1
        pos = len(array) - 1 if reverse else 0 # 游标
        for index in range(arrmin, arrmax + 1): # 从最小的数开始
            amount = count[index - arrmin]
            while amount >= 1:
                array[pos] = index
                amount -= 1
                pos = pos - 1 if reverse else pos + 1
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19

    enumerate函数

    def counting_sort(array: List[int], reverse: bool=False) -> None:
        '''
        array: 仅支持全为整数类型的数据。
        reverse: 是否降序, 默认采用升序。
        '''
        if not array:
            return None
        arrmin = min(array)
        arrmax = max(array)
        count = [0] * (arrmax - arrmin + 1)
        for value in array:
            count[value - arrmin] += 1
        array.clear()
        for index, val in enumerate(count):
            for _ in range(val):
                _ = array.insert(0, index + arrmin) if reverse else array.append(index + arrmin)
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16

    反向填充

    反向填充是为了维持排序算法的稳定性:

    def counting_sort(array: List[int], reverse: bool=False) -> List[int]:
        '''
        array: 仅支持全为整数类型的数据。
        reverse: 是否降序, 默认采用升序。
        '''
        if not array:
            return array
        arrmin = min(array)
        arrmax = max(array)
        length = len(array)
        count = [0] * (arrmax - arrmin + 1)
        result = [0] * length
        for value in array:
            count[value - arrmin] += 1
        for index in range(1, arrmax - arrmin + 1):
            count[index] += count[index - 1]
        for index in range(len(array) - 1, -1, -1):
            pos = count[array[index] - arrmin]
            result[length - pos if reverse else pos - 1] = array[index]
            pos -= 1
        return result
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
  • 相关阅读:
    docker login harbor http login登录
    计算机毕设 LSTM的预测算法 - 股票预测 天气预测 房价预测
    基于Django搭建服务器平台的投票应用
    数字图像处理(十五)图像旋转
    如何看待中小企业实现数字化转型难的问题?_光点科技
    生长刺激表达基因2蛋白(ST2)介绍
    Android显示系统详解
    Linux系统换源
    php实战案例记录(18)PHP 来截断指定位数的字符串
    linux内核中的SPI
  • 原文地址:https://blog.csdn.net/linjing_zyq/article/details/126149010