• 排序算法-计数排序


    一、计数排序

           这种排序算法 是利用数组下标来确定元素的正确位置的。

          如果数组中有20个随机整数,取值范围为0~10,要求用最快的速度把这20个整数从小到大进行排序。 很大的情况下,它的性能甚至快过那些时间复杂度为O(nlogn)的排序。

        9,3,5,4,9,1,2,7,8,1,3,6,5,3,4,0,10,9,7,9

       考虑到这些整数只能够在0、1、2、3、4、5、6、7、8、9、10这11个数中取值,取值范围有限。可以根据这有限的范围,建立一个长度为11的数组。数组下标从0到10,元素初始值全为0

        下面就开始遍历这个无序的随机数列,每一个整数按照其值对号入座,同时对应数组下标元素进行加1操作。

        根据这个统计结果,排序就很简单了。直接遍历数组,输出数组元素的下标 值,元素的值是几,就输出几次: 0,1,1,2,3,3,3,4,4,5,5,6,7,7,8,9,9,9,9,10

        计数排序的基本过程,它适用于一定范围内的整数排序。在取值范围不是 很大的情况下,它的性能甚至快过那些时间复杂度为O(nlogn)的排序。

    1. def countSort(ll):
    2. # 1.得到数列的最大值
    3. max=ll[0]
    4. for i in range(1,len(ll)):
    5. if ll[i]>max:
    6. max=ll[i]
    7. # print(max)
    8. # 2.根据数列最大值确定统计数组大小,并赋值0;
    9. arrs=[0]*(max+1)
    10. print(arrs)
    11. # 3.遍历数列,填充统计数组
    12. for i in range(len(arrs)):
    13. arrs[ll[i]]+=1
    14. print(arrs)
    15. # 4.遍历数列
    16. sorted_arrs=[]
    17. for i in range(len(arrs)):
    18. for j in range(0,arrs[i]):
    19. # print(i)
    20. sorted_arrs.append(i)
    21. #返回排序数组
    22. return sorted_arrs
    23. if __name__ == '__main__':
    24. ll=[9,3,5,4,9,1,2,7,8,1,10]
    25. print(ll)
    26. print(countSort(ll))

     

    以上是找数列的最大值来决定统计数组的长度,其实并不严谨 。

    如: 96,93,91,94,95,90,99, 93,91,90

    这个数列的最大值是99,但最小的整数是90。如果创建长度为100的数组,那么前面从0到89的空间位置就都浪费了!

        很简单,只要不再以输入数列的最大值+1作为统计数组的长度,而是以数列最大值-最小值+1作为统计数组的长度即可。 同时数列的最小值作为一个偏移量,用于计算整数在统计数组中的下标。 

    统计出数组的长度:99-90+1=10,偏移量等于数列的最小值90对于第1个整数96,对应的统计数组下标是96-90=6

    如下图所示: 同时数列的最小值作为一个偏移量,用于计算整数在统计数组中的下标。 

     如果学生成绩表,要求按成绩从低到高进行排序,如果成绩相同,则遵循原表固有顺序。

     如图所示:

    这是变形,其实就是从统计数组的第2个元素开始,每一个元素都加上前面所有元素之和。 

    步骤1:遍历成绩表最后一行的小绿同学的成绩。

    小绿的成绩是95分,找到count_array下标是5的元素,值是4,代表小绿的成绩排名位置在第4位。 同时,给count_array下标是5的元素值减1,从4变成3,代表下次再遇到95分的成绩时,最终排名是第3。 

     

    步骤2:遍历成绩表倒数第二行的小白同学的成绩。 

     

    步骤3:遍历成绩表倒数第三行的小红同学的成绩。  

     

    重复上面的步骤继续完成! 

    1. '''优化'''
    2. def countSort2(ll):
    3. # 1.得到数列的最大值,最小值
    4. max=ll[0]
    5. min=ll[0]
    6. for i in range(1,len(ll)):
    7. if ll[i]>max:
    8. max=ll[i]
    9. if ll[i]<min:
    10. min=ll[i]
    11. #差值
    12. diff=max-min
    13. # print(diff)
    14. # 2.确定统计数组大小,并赋值0;
    15. arrs=[0]*(diff+1)
    16. # print(arrs)
    17. # 3.遍历数列,填充统计数组
    18. for i in range(len(ll)):
    19. arrs[ll[i]-min]+=1 #如:95-90=5,94-90=4
    20. print(arrs)
    21. # 4.统计数组变形,从第二个元素开始,后面的元素等于前面的元素之和
    22. for i in range(1,len(ll)):
    23. arrs[i]+=arrs[i-1] #1+2,3+1,4+1...
    24. print(arrs)
    25. # 5.排序数列
    26. sorted_arrs=[0]*len(ll)
    27. # 倒序遍历原始数列,从统计数组找到正确位置
    28. for i in range(len(ll)-1,-1,-1):
    29. sorted_arrs[arrs[ll[i]-min]-1]=ll[i] #92-90-1=1;1是排序数列下标,再将对应原始数据最后一个赋值到这个下标。
    30. arrs[ll[i] - min] -= 1 #arrs[92-90]-1=arrs[2]-1=1
    31. # #返回排序数组
    32. return sorted_arrs
    33. if __name__ == '__main__':
    34. ll = [95,94,91,98,99,90,99,93,91,92]
    35. print(ll)
    36. print(countSort2(ll))

    计数排序有它的局限性,主要表现两点:

    1、当数列最大和最小值差距过大时,并不适合用计数排序。

        如:给出20个随机整数,范围在0到1亿之间,这时如果使用计数排序,需要创建长度为1亿的数组。不但严重浪费空间,而且时间复杂度也会随之升高。

    2、当数列元素不是整数时,也不适合用计数排序。

      如果数列中的元素都是小数,如25.213或0.000001这样的数字,则无法创建对应的统计数组。

  • 相关阅读:
    深度学习-第T5周——运动鞋品牌识别
    矩阵初等变换与方阵可逆的条件
    【Objective -- C】—— block
    编程语言是都一样的,吗?
    Cas 80750-24-9,去硫代生物素 N-羟基琥珀酰亚胺,淡黄色固体
    进程的概念
    AWS SAA-C03 #36
    自动售卖团餐:借助智享直播AI实景无人直播系统,团餐自动售卖,无需人工参与,省时高效。
    解决微信环境下无法通过链接唤起App Store、微信访问App Store 链接白屏问题
    C# 遍历
  • 原文地址:https://blog.csdn.net/hlx20080808/article/details/138193704