计数排序(CountSort)是一个非基于比较的排序算法,该算法于1954年由 Harold H. Seward 提出。它的优势在于在对一定范围内的整数排序时,它的复杂度为Ο(n+k)(其中k是整数的范围),快于任何比较排序算法。当然这是一种牺牲空间换取时间的做法,而且当O(k)>O(n*log(n))的时候其效率反而不如基于比较的排序(基于比较的排序的时间复杂度在理论上的下限是O(n*log(n)), 如归并排序,堆排序) ————百度百科
计数排序对输入的数据有附加的限制条件:
2、设输入的线性表的长度为n,|S|=k(表示集合S中元素的总数目为k),则k=O(n)。
在这两个条件下,计数排序的复杂性为O(n)。
计数排序的基本思想是对于给定的输入序列中的每一个元素x,确定该序列中值小于x的元素的个数(此处并非比较各元素的大小,而是通过对元素值的计数和计数值的累加来确定)。一旦有了这个信息,就可以将x直接存放到最终的输出序列的正确位置上。例如,如果输入序列中只有17个元素的值小于x的值,则x可以直接存放在输出序列的第18个位置上。当然,如果有多个元素具有相同的值时,我们不能将这些元素放在输出序列的同一个位置上,因此,上述方案还要作适当的修改。
实际上,计数排序是将待排序数组的值对应新数组的下标,新数组首先全部初始化为0,只要遇到待排序元素与新数组下标相等便+1,最终在将新数组中的数据按顺序存回原来的数组,这样数组中的元素就有序了。
假如有一组数据的范围为101~199范围内的数据,这个时候用计数排序难道还要从0开始创建新的数组吗?这样肯定是浪费空间的,所以我们在创建新数组之前可以先便利出数据的最大值和最小值,那么数组的长度就为:ArrSize = Max - Min + 1 ,在找对应下标的时候每个数据都要减去Min值找到对应下标,在排序过程中在将Min值给加上,这样就可以更好的节省一些空间。
这样计数排序就完成了。
计数排序实现其实就比较简单了,按照上述步骤来一步一步的实现出来,代码如下:
- #include
- #include
- #include
- #include
-
- void CountSort(int *a, int len)//计数排序
- {
- assert(a);
- int max = 0, min = 0;//初始化最大最小值
- int i = 0;
- for(i = 1 ; i < len ; i++)//将数据中的最大值最小值找出来
- {
- if(a[max] < a[i])
- {
- max = i;
- }
-
- if(a[min] > a[i])
- {
- min = i;
- }
- }
-
- int range = a[max] - a[min] + 1;//记录新数组长度Max - Min + 1
-
- int *countArr = (int *)malloc(sizeof(int) * range);//开辟新数组
- if(countArr == NULL)//数组检查是否开辟成功
- {
- perror("malloc");
- exit(-1);
- }
-
- memset(countArr, 0, range * sizeof(int));//将新数组全部置零
-
- for(i = 0 ; i < len ; i++)//开始进行计数存储到新数组中
- {
- countArr[a[i] - a[min]]++;//对应下标进行自增
- }
-
- //sort
- int j = 0;
- for(i = 0 ; i < range ; i++)//开始排序
- {
- while(countArr[i]--)
- {
- a[j++] = i + min;//放回原数组
- }
- }
- free(countArr);//销毁创建的数组,排序完成
- }
-
- void output(int *a, int len)//输出排序内容
- {
- assert(a);
- int i = 0;
- for(i = 0 ; i < len ; i++)
- {
- printf("%3d",a[i]);
- }
- printf("\n");
- return;
- }
-
- void Test()
- {
- int a[] = { 5, 1, 7, 8, 2, 3, 6, 4 };
- int len = sizeof(a) / sizeof(int);
- CountSort(a, len);
- output(a, len);
- return;
- }
-
- int main()
- {
- Test();
- return 0;
- }
显然,计数排序适合数据类型大量、集中、重复数据的一把好手,这同时也体现了它的局限性,数据的范围特别大的时候同时也要开辟很大的空间,但是这也不妨碍它在许多排序中的地位,合理利用基数排序或许会有奇效。
如果各位大佬觉得有用,不妨给up一个小小的三连支持一下吧~~[玫瑰][玫瑰]