计数排序(六)——计数排序及排序总结

目录

一.前言

二.归并小补充

三.计数排序

操作步骤:

代码部分:

四.稳定性的概念:

五.排序大总结:

​六.结语


一.前言

我们已经进入排序的尾篇了,本篇主要讲述计数排序以及汇总各类排序的特点。码字不易,希望大家多多支持我呀!(三连+关注,你是我滴神!)

二.归并小补充

 归并排序即有外排序,也有内排序,这是它的弊端所在。

计数排序(六)——计数排序及排序总结_第1张图片

当数据太多的时候,就会把数据存在磁盘中。

假设我们有大约4G的数据那要选择什么排序好呢?

计数排序(六)——计数排序及排序总结_第2张图片

我们这里不能用希尔排序因为在磁盘中是不支持下标访问的。磁盘的特点是顺序写,顺序读。所以在这里只有归并排序在可以做到在磁盘中排序。

计数排序(六)——计数排序及排序总结_第3张图片

但别忘了我们还有1G的内存,我们把让小文件在里面进行排序再拿出来。这时候内存中的排序就可以用希尔排序了。

然后我们再通过合并两个有序序列的相关操作,用fscanf来读对比两个文件中谁小再fprintf写到大文件中去。

计数排序(六)——计数排序及排序总结_第4张图片

 以此类推

计数排序(六)——计数排序及排序总结_第5张图片

最后我们再对两个大文件进行对比,然后覆盖写入原文件中去。 

计数排序(六)——计数排序及排序总结_第6张图片

三.计数排序

思想:计数排序又称为鸽巢原理,是对哈希直接定址法的变形应用。

操作步骤:

  1. 统计相同元素出现次数
  2. 根据统计的结果将序列回收到原来的序列中

计数排序(六)——计数排序及排序总结_第7张图片

计数排序的特性总结:

计数排序在数据范围集中时,效率很高,但是适用范围及场景有限

时间复杂度:O(MAX(N,范围))

空间复杂度:O(范围)

稳定性:稳定 

接下来我们开始进行分析:

每个值对应一个位置,如5就对下标为5的地方++。

计数排序(六)——计数排序及排序总结_第8张图片

对所有值开始计数

计数排序(六)——计数排序及排序总结_第9张图片

当统计好出现的次数时,我们又应该如何排序呢?

在原数组中,0出现0次那我们就覆盖写0次,1出现3次,那我们就依次覆盖写3次.......

计数排序(六)——计数排序及排序总结_第10张图片

之所以会有排序的效果是因为我们count遍历的时候是从小到大去遍历的。

该排序也是有局限性的,在我们新的数据中最大数是199,那我们就得开200个空间去遍历它们,可是前面有100空间是浪费的,因为没有数出现在那。

这种方法本质是绝对映射,值为多少那么下标就为多少。

计数排序(六)——计数排序及排序总结_第11张图片

为了避免空间的浪费,我们采用的相对映射的方法,在投影下标时用该数减数据中的最小值就能得到相对位置,而在我们需要往回去覆盖时重新+最小值就可以回到原来的位置。这种适合范围相对集中的时候,如果出现绝对大的值那就不行了。

计数排序(六)——计数排序及排序总结_第12张图片

代码部分:

代码其实很好写,最关键的是要知道如何处理相对映射时的下标转换,以及返回覆盖时重新加上最小值。

void CountSort(int* a, int n)
{
	//找出最大与最小
	int max = a[0];
	int min = a[0];
	for (int i = 0; i < n; i++)
	{
		if (a[i] < min)
		{
			min = a[i];
		}
		if (a[i] > max)
		{
			max = a[i];
		}
	}
	//划定范围
	int range = max - min + 1;
	//创建count数组
	int* count = (int*)malloc(sizeof(int) * range);
	if (count == NULL)
	{
		perror("malloc faile");
		return;
	}

	//初始化数组
	memset(count, 0, sizeof(int) * range);

	//开始计数
	for (int i = 0; i < n; i++)
	{
		//记住要用到相对映射
		//往count数组里面计数
		count[a[i] - min]++;
	}
	//开始覆盖,最重要的一步
	int j = 0;
	for (int i = 0; i < range; i++)
	{
		while (count[i]--)
		{
			a[j] = i + min;
			j++;
		}
	}
}

时间复杂度:O(N+range)

因为我们不仅仅要遍历原数组a,还要遍历count数组。如果数据范围很大,那么range影响就大。

对于空间复杂度也是同理。

所以计数排序适用于数据范围集中的时候。

四.稳定性的概念:

如果排完序后能保证红5还在黑5的前面,那么这个排序就是稳定的。相同数据的顺序是否变化——相对顺序)

计数排序(六)——计数排序及排序总结_第13张图片

稳定性的意义:

假设我们比赛的时候有选手的分数是相同的,那我们就要看谁先提交,那谁就排前面。

计数排序(六)——计数排序及排序总结_第14张图片

计数排序(六)——计数排序及排序总结_第15张图片

五.排序大总结:

其中选择排序之所以不稳定是因为在确保1相对稳定时,我们无法保证3的相对稳定。

堆排序中因为堆顶的值要进行交换,所以也不能保证稳定性

计数排序(六)——计数排序及排序总结_第16张图片

快速排序也无法保证稳定性,当有3个5时,如果左边的5作key,那么它就会换到中间去,就破坏了相对顺序了。 

计数排序(六)——计数排序及排序总结_第17张图片

归并是可以做到稳定的,只要我们在取小插入的过程中把<改成<=就行了。 

计数排序(六)——计数排序及排序总结_第18张图片

计数排序(六)——计数排序及排序总结_第19张图片

4b12323f94834afd9ec146a3c10df229.jpeg六.结语

排序正式完结了,感谢大家对我的支持与陪伴,我会努力写出更通俗易懂的文章。最后感谢大家的观看,友友们能够学习到新的知识是额滴荣幸,期待我们下次相见~kk

你可能感兴趣的:(数据结构,数据结构,排序算法,算法,c语言)