计数排序详解

一、什么是计数排序？

计数排序(CountSort)是一个非基于比较的排序算法，该算法于1954年由 Harold H. Seward 提出。它的优势在于在对一定范围内的整数排序时，它的复杂度为Ο(n+k)（其中k是整数的范围），快于任何比较排序算法。当然这是一种牺牲空间换取时间的做法，而且当O(k)>O(n*log(n))的时候其效率反而不如基于比较的排序（基于比较的排序的时间复杂度在理论上的下限是O(n*log(n)), 如归并排序，堆排序） ————百度百科

计数排序对输入的数据有附加的限制条件：

1、输入的线性表的元素属于有限偏序集S；

2、设输入的线性表的长度为n，|S|=k（表示集合S中元素的总数目为k），则k=O(n)。

在这两个条件下，计数排序的复杂性为O(n)。

计数排序的基本思想是对于给定的输入序列中的每一个元素x，确定该序列中值小于x的元素的个数（此处并非比较各元素的大小，而是通过对元素值的计数和计数值的累加来确定）。一旦有了这个信息，就可以将x直接存放到最终的输出序列的正确位置上。例如，如果输入序列中只有17个元素的值小于x的值，则x可以直接存放在输出序列的第18个位置上。当然，如果有多个元素具有相同的值时，我们不能将这些元素放在输出序列的同一个位置上，因此，上述方案还要作适当的修改。

实际上，计数排序是将待排序数组的值对应新数组的下标，新数组首先全部初始化为0，只要遇到待排序元素与新数组下标相等便+1，最终在将新数组中的数据按顺序存回原来的数组，这样数组中的元素就有序了。

假如有一组数据的范围为101~199范围内的数据，这个时候用计数排序难道还要从0开始创建新的数组吗？这样肯定是浪费空间的，所以我们在创建新数组之前可以先便利出数据的最大值和最小值，那么数组的长度就为：ArrSize = Max - Min + 1 ，在找对应下标的时候每个数据都要减去Min值找到对应下标，在排序过程中在将Min值给加上，这样就可以更好的节省一些空间。

这样计数排序就完成了。

二、计数排序的实现方式：

计数排序实现其实就比较简单了，按照上述步骤来一步一步的实现出来，代码如下：


#include
#include
#include
#include
 
void CountSort(int *a, int len)//计数排序
{
	assert(a);
	int max = 0, min = 0;//初始化最大最小值
	int i = 0;
	for(i = 1 ; i < len ; i++)//将数据中的最大值最小值找出来
	{
		if(a[max] < a[i])
		{
			max = i;
		}
		
		if(a[min] > a[i])
		{
			min = i;
		}
	}
	
	int range = a[max] - a[min] + 1;//记录新数组长度Max - Min + 1
	
	int *countArr = (int *)malloc(sizeof(int) * range);//开辟新数组
	if(countArr == NULL)//数组检查是否开辟成功
	{
		perror("malloc");
		exit(-1);
	}
	
	memset(countArr, 0, range * sizeof(int));//将新数组全部置零
	
	for(i = 0 ; i < len ; i++)//开始进行计数存储到新数组中
	{
		countArr[a[i] - a[min]]++;//对应下标进行自增
	}
	
	//sort
	int j = 0;
	for(i = 0 ; i < range ; i++)//开始排序
	{
		while(countArr[i]--)
		{
			a[j++] = i + min;//放回原数组
		}
	}
    free(countArr);//销毁创建的数组，排序完成
}
 
void output(int *a, int len)//输出排序内容
{
	assert(a);
	int i = 0;
	for(i = 0 ; i < len ; i++)
	{
		printf("%3d",a[i]);
	}
	printf("\n");
	return;
}
 
void Test()
{
	int a[] = { 5, 1, 7, 8, 2, 3, 6, 4 };
	int len = sizeof(a) / sizeof(int);
	CountSort(a, len);
	output(a, len);
	return;
}
 
int main()
{
	Test();
	return 0;
}

三、计数排序适用场景：

显然，计数排序适合数据类型大量、集中、重复数据的一把好手，这同时也体现了它的局限性，数据的范围特别大的时候同时也要开辟很大的空间，但是这也不妨碍它在许多排序中的地位，合理利用基数排序或许会有奇效。

如果各位大佬觉得有用，不妨给up一个小小的三连支持一下吧~~[玫瑰][玫瑰]

相关阅读:
LeetCode -- 79.单词搜索
Springboot：拦截器和过滤器
【网络协议详解】——FTP系统协议（学习笔记）
学习-Java数组之Arrays类操作数组之填充替换数组元素
Wordpress替换Gravatar用户头像，让wordpress会员头像本地化提高加载速度（附代码）
Biotinyl-εAhx-Amyloid β-Protein (1-42)，CAS: 1872440-40-8
我的创作纪念日
认证双软需要什么样的基本条件？
AVL树实现
Luckysheet 实现excel多人在线协同编辑

原文地址：https://blog.csdn.net/qq_73708736/article/details/133896471