• 基于桶的排序之基数排序以及排序方法总结


    基于桶的排序之基数排序以及排序方法总结

    作者:Grey

    原文地址:

    博客园:基于桶的排序之基数排序以及排序方法总结

    CSDN:基于桶的排序之基数排序以及排序方法总结

    说明

    基于桶的排序有两种,分别是计数排序基数排序

    但是这两种排序应用范围有限,需要样本的数据状况满足桶的划分

    计数排序算法说明见:基于桶的排序之计数排序

    基数排序

    一般来讲,基数排序要求,样本是 10 进制的正整数, 流程如下

    第一步:找到最大值,这个最大值是几位的,其他数不足这个位数的,用 0 补齐;

    例如:

    原始数组为

    arr = {17,210,3065,40,71,2}
    
    • 1

    最大值为 3065,是四位的,其他都不是四位的,前面用 0 补充,所以先让数组变成

    arr = {0017,0210,3065,0040,0071,0002}
    
    • 1

    第二步:准备 10 个桶,每个桶是队列;

    第三步:从个位依次进桶(和对应桶中的元素用队列相连),然后依次倒出;然后根据十位数进桶(和对应桶中的元素用队列相连),依次倒出;以此类推,一直到最高进桶,然后倒出。最后倒出的顺序就是排序后的结果。

    以上述数组为例,基数排序的整个流程如下

    第一轮入桶,个位上的数依次是:7,0,5,0,1,2,入桶后,是如下效果:

    image

    然后出桶,第一轮结果是{0210,0040,0071,0002,3065,0017};

    第二轮入桶,十位上的数字分别是:1,4,7,0,6,1,入桶后,效果如下:

    image

    第二轮出桶:结果是{0002,0210,0017,0040,3065,0071};

    第三轮入桶,百位上的数字分别是:0,2,0,0,0,0,入桶后,效果如下:

    image

    第四轮入桶,也是最后一轮入桶,千位上的数字分别是:0,0,0,3,0,0,入桶后,效果如下:

    image

    最后一轮出桶:结果是{0002,0017,0040,0071,0210,3065},已排好序。

    上述是基数排序的流程,但是在算法实现上,有更优化的解法

    根据整个基数排序的算法,代码上做了一些优化,用了一个包含十个元素的数组count来表示桶,而且整个代码没有用队列这个数据结构,仅用 count 数组就实现了入桶和出桶的过程,接下来一一分析一下代码,其中helper数组用于存排序后的数组,bits表示最大数十进制一共有几位,流程和之前提到的算法流程一致:

    // 从个位开始,一直到最高位,不断入桶出桶
    for (int bit = 1; bit <= bits; bit++) {
        // 入桶
        // 出桶
    }
    
    • 1
    • 2
    • 3
    • 4
    • 5

    入桶的逻辑,原先我们需要把入桶的值记录到桶对应的队列中,如今不需要,我们只需要记录一个个数即可,就是如下逻辑

    // 从个位开始,一直到最高位,不断入桶出桶
    for (int bit = 1; bit <= bits; bit++) {
        int[] count = new int[10];
        for (int num : arr) {
            count[digit(num, bit)]++;
        }
        // 出桶
    }
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8

    以上述示例数组来说明,示例数组初始状态是{0017,0210,3065,0040,0071,0002},经过第一轮个位数的入桶操作,count数组会变成{2,1,1,0,0,1,0,1,0,0},如下示例图

    原始算法

    image

    用 count 优化后

    image

    可以看到 count 只存了数组中的数的有相同位数值的数有多少个。

    比如:

    count[0] = 2; // 说明 0 号桶在第一轮入桶的时候,有两个数,也说明个位上是 0 的数有两个。
    count[5] = 1; // 说明 5 号桶在第一轮入桶的时候,有一个数,也说明个位上是 5 的数有一个。
    ......
    
    • 1
    • 2
    • 3

    接下来是出桶操作,原始算法中,值存在队列,从左到右遍历桶,桶中元素按队列遍历出来即可;优化后,只有一个count数组,count 数组只记录了个数,如何实现出桶呢? 客观上,在第一轮中,出桶顺序是{0210,0040,0071,0002,3065,0017},其实,就是出桶编号从小到大,桶中的数依次出来。

    基于第一轮的count={2,1,1,0,0,1,0,1,0,0}可得到其前缀和数组{2,3,4,4,4,5,5,6,6,6},最大编号且包含数组元素的桶是 7 号桶,且 7 号桶中只有一个数,就是 0017 ,所以这个数一定是最后出桶的那个数!接下来包含元素的最大桶编号是 5 号桶,5 号桶只有一个数,就是 3065,这个数一定是倒数第二顺序出来的数!依次类推,就可以把所有第一轮出桶的数按顺序提取出来,核心代码入下:

          // 前缀和
          for (int j = 1; j < 10; j++) {
            count[j] = count[j - 1] + count[j];
          }
          // 倒序遍历数组
          for (int i = arr.length - 1; i >= 0; i--) {
            int pos = digit(arr[i], bit);
            // 数组中某一位是 pos 的数,在某一轮入桶后
            // 出桶的时候,应该处在什么位置!!!
            help[--count[pos]] = arr[i];
          }
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11

    完整代码见

    public class Code_RadixSort {
    
      // 非负数
      public static void radixSort(int[] arr) {
        if (arr == null || arr.length <= 1) {
          return;
        }
        int max = arr[0];
        for (int i = 1; i < arr.length; i++) {
          max = Math.max(arr[i], max);
        }
        // 最大值有几位
        int bits = 0;
        while (max != 0) {
          bits++;
          max /= 10;
        }
        int[] help = new int[arr.length];
        for (int bit = 1; bit <= bits; bit++) {
          int[] count = new int[10];
          for (int num : arr) {
            count[digit(num, bit)]++;
          }
          // 前缀和
          for (int j = 1; j < 10; j++) {
            count[j] = count[j - 1] + count[j];
          }
          // 倒序遍历数组
          for (int i = arr.length - 1; i >= 0; i--) {
            int pos = digit(arr[i], bit);
            help[--count[pos]] = arr[i];
          }
          int m = 0;
          for (int num : help) {
            arr[m++] = num;
          }
        }
      }
    
      // 获取某个数在某一位上的值
      // 从1开始,从个位开始
      public static int digit(int num, int digit) {
        return ((num / (int) Math.pow(10, digit - 1)) % 10);
      }
    }
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22
    • 23
    • 24
    • 25
    • 26
    • 27
    • 28
    • 29
    • 30
    • 31
    • 32
    • 33
    • 34
    • 35
    • 36
    • 37
    • 38
    • 39
    • 40
    • 41
    • 42
    • 43
    • 44
    • 45

    排序总结

    时间复杂度额外空间复杂度稳定性
    选择排序O(N^2)O(1)
    冒泡排序O(N^2)O(1)
    插入排序O(N^2)O(1)
    归并排序O(N*logN)O(N)
    随机快排O(N*logN)O(logN)
    堆排序O(N*logN)O(1)
    计数排序O(N)O(M)
    基数排序O(N)O(N)

    选择排序做不到稳定性,比如:5,5,5,5,5,3,5,5,5

    冒泡排序可以做到稳定性,在相等的时候,不往右即可

    插入排序可以做到稳定性,在相等的时候,不往左边继续交换即可

    快排做不到稳定性,因为partition过程无法稳定,某个数会和小于等于区域交换

    0)排序稳定性关键在于处理相等的时候

    1)不基于比较的排序,对样本数据有严格要求,不易改写

    2)基于比较的排序,只要规定好两个样本怎么比大小就可以直接复用

    3)基于比较的排序,时间复杂度的极限是O(N*logN)

    4)时间复杂度O(N*logN)、额外空间复杂度低于O(N)、且稳定的基于比较的排序是不存在的。

    5)为了绝对的速度选快排、为了省空间选堆排、为了稳定性选归并

    更多

    算法和数据结构笔记

    参考资料

    算法和数据结构体系班-左程云

  • 相关阅读:
    Java 如何让HashMap集合按照key进行排序呢?
    Windows系统下安装Ubuntu系统(双系统)
    网页按钮点击动画
    libfaad2 主机编译和交叉编译
    安卓app源码和设计报告——简易记账本
    JAVA【Apache-DBUtils实现CRUD】
    VMware 与 SmartX 超融合 I/O 路径对比与性能影响解析
    1686. 石子游戏 VI
    [Linux]关于在国产操作系统上安装Oracle数据库
    信道加密设备与网络加密设备差异性研究和运维保障管理
  • 原文地址:https://blog.csdn.net/hotonyhui/article/details/128061672