• 基数排序(Radix Sort)


    基数排序(Radix Sort)

    一、基本思想

    基数排序是一种非比较型整数排序算法,是桶排序的扩展。基本思想是:取得所有数的数位并统一为相同的长度,数位较短的数字前面补零。从低位开始排序,分别放入0~9个队列中,然后采用先进先出的原则进行收集;在按照高位排序,然后在收集;依次类推,直到最高位,最终得到排好序的数列。对于数值偏小的一组序列,该算法速度非常快,时间复杂度可以达到线性。

    二、实现逻辑

    该算法的核心在对数字按位数从低到高进行排序。

    算法步骤:

    1. 取得数组中的最大数并取得位数;
    2. 对数位较短的数进行前面补零;
    3. 从个位开始分配,根据位值(09)分别放在(09)号桶中;
    4. 收集数据放在(0~9)号桶中的数据按顺序放到数组中;
    5. 重复3~4过程,直到最高位,即可完成排序。

    三、时间复杂度的分析

    单从LSD算法的角度分析,外层循环产生了 Ω ( k ) \Omega(k) Ω(k) Θ ( k ) \Theta(k) Θ(k) O ( k ) O(k) O(k)。其中 k = 最大位数,内层遍历数组产生了 Ω ( n ) \Omega(n) Ω(n) Θ ( n ) \Theta(n) Θ(n) O ( n ) O(n) O(n),故时间复杂度为: Ω ( n k ) \Omega(nk) Ω(nk) Θ ( n k ) \Theta(nk) Θ(nk) O ( n k ) O(nk) O(nk)。若引入反向填充计数排序,内层产生的时间复杂度会减小;若不引入,那么内层会额外产生 Ω ( r ) \Omega(r) Ω(r) Θ ( r ) \Theta(r) Θ(r) O ( r ) O(r) O(r),其中 r=10r,r 为容器内数据的个数。故时间复杂度为: Ω ( ( n + r ) k ) \Omega((n+r)k) Ω((n+r)k) Θ ( ( n + r ) k ) \Theta((n+r)k) Θ((n+r)k) O ( ( n + r ) k ) O((n+r)k) O((n+r)k)

    四、空间复杂度的分析

    LSD算法中,由于逐次清理 array 中数据,外层每一循环会开辟大小为 10 的桶,那么空间复杂度为: O ( k ) O(k) O(k),或者记为: O ( n + k ) O(n+k) O(n+k)

    五、算法实现

    按低位排序

    def radix_sort(array: List[int], reverse: bool=False) -> List[int]:
        '''
        array: 支持数值型数据,如整型与浮点型混合;支持全为字符串类型的数据;不支持字符串型与数值型混合。
        reverse: 是否降序, 默认采用升序。
        '''
        numbers = len(str(max(array))) # note the length of the biggest num
        for step in range(numbers):
            container = [[] for _ in range(10)] # 0~9
            for value in array:
                pos = value // (10 ** step) % 10
                container[9 - pos if reverse else pos].append(value) # 取个位
            array.clear()
            array = [value for index in container for value in index] # 未引入反向填充
        return array
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14

    按高位排序

    def radix_sort(array: List[int], radix: int=6, reverse: bool=False) -> List[int]:
        '''
        array: 支持数值型数据,如整型与浮点型混合;支持全为字符串类型的数据;不支持字符串型与数值型混合。
        radix: 基数大小, 最好取用最大数的位数。
        reverse: 是否降序, 默认采用升序。
        '''
        container, num, k = [[] for _ in range(10)], [0] * 10, pow(10, radix - 1)
        for value in array:
            pos = value // k % 10
            container[pos].append(value)
            num[pos] += 1 # 基于计数排序
        array.clear()
        for index in range(10):
            if num[index] == 1:
                array.append(container[index][0]) # 退出
            elif num[index] > 1:
                con = msd(container[index], radix - 1)
                array.extend(con)
        if reverse:
            array.reverse()
        return array
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
  • 相关阅读:
    「Java开发指南」MyEclipse如何支持Spring Scaffolding?(三)
    操作系统浅谈
    VoLTE端到端业务详解 | 会话管理类
    处理Java异常的10个最佳实践
    SpringBoot打war包并配置外部Tomcat运行
    【微服务生态】Docker
    OpenCV中的RGB与YUV转换
    右值引用+移动语义
    Probuf定义详解
    PHP Session
  • 原文地址:https://blog.csdn.net/linjing_zyq/article/details/126243813