数据结构——排序

前言:哈喽小伙伴们好久不见,也是顺利的考完试迎来了寒假。众所周知,不怕同学是学霸,就怕学霸放寒假,假期身为弯道超车的最佳时间,我们定然是不能懒散的度过。

今天我们就一起来学习数据结构初阶的终章——七大排序

本文所有的排序演示都为升序排序


目录

一.为什么要排序

二.七大排序

1.冒泡排序

2.选择排序

3.堆排序

4.插入排序

5.希尔排序

6.快速排序

7.归并排序

三.总结


一.为什么要排序

我们知道,数据结构的诞生是为了存放和管理众多的数据。而排序,就是最常用也是必不可少的数据管理方式,能够帮助我们更加轻松和方便的去找到自己想要的结果。


二.七大排序

数据结构中常用的排序有七种:

  • 冒泡排序
  • 选择排序
  • 堆排序
  • 插入排序
  • 希尔排序
  • 快速排序
  • 归并排序

下面我们就来一一讲解这七大排序的排序方式及其性能优劣


1.冒泡排序

冒泡排序相信有很多小伙伴在学习C语言的时候就已经有所了解了,如下图所示,冒泡排序是从一组数据的第一个元素开始两个两个紧挨着进行比较,如果前者大于后者就进行交换,这样便可以使每排序一次就可以将最大值置于数据末尾

注意,这里紧挨着排序是指,1和2排完之后,2紧接着和3排

数据结构——排序_第1张图片

冒泡排序的原码如下: 

void BubbleSort(int* a, int n)
{
	for (int j = 0; j < n; j++)
	{
		bool flag = false;
		for (int i = 0; i < n - 1 - j; i++)
		{
			if (a[i] > a[i + 1])
			{
				Swap(&a[i], &a[i + 1]);
				flag = true;
			}
		}
		if (flag == false)
			break;
	}
}

能够看出,冒泡排序需要两层循环控制,内层循环控制单趟排序,外层循环控制总排序次数

n表示数据个数,所以总共需要排序n-1次,即外层循环的次数,同样也是n个数据之间两两比较的次数

因为每经过一轮排序,我们都能排好最大值,所以每下一次排序都比上一次少一个数据,所以我们通过i < n - 1 - j 的方式就可以完美实现这一点。当然你也可以定义一个新变量去控制,但是这样会扩大空间复杂度。

冒泡排序的时间复杂度和空间复杂度:

  • 时间复杂度:O(N^2)
  • 空间复杂度:O(1)

在数据本来就有序的情况下,冒泡排序的最优时间复杂度为:O(N),即仅仅比较了数据大小,没有进行交换,所以我们可以设计一个“探子”flag去打探数据是否交换,如果进行一次内循环发现没有交换,就说明数据本来就有序,便直接退出外循环,节省时间


2.选择排序

选择排序相较于冒泡排序,它是能够一次确定头尾两个位置元素的排序方式:

先定义begin和end两个标志点,分别代表要排序数据的头和尾,然后默认一段乱序数据的第一个元素同时为最小值min、最大值max,然后从第二个数据开始分别去和它们比较,更小的值替换min,更大的值替换max,循环一次便能找到当前序列的最大值和最小值,然后再去分别和头尾元素交换,如此循环便可得出有序序列。

原码如下:

void SelectSort(int* a, int n)
{
	int begin = 0;
	int end = n - 1;
	while (begin < end)
	{
		int mini = begin;
		int maxi = begin;
		for (int i = begin + 1; i <= end; i++)
		{
			if (a[i] < a[mini])
			{
				mini = i;
			}
			if (a[i] > a[maxi])
			{
				maxi = i;
			}
		}
		Swap(&a[begin], &a[mini]);
		if (maxi == begin)
		{
			maxi = mini;
		}
		Swap(&a[end], &a[maxi]);
		begin++;
		end--;
	}
}

不难看出,内层循环每进行一次,就能确定最大值和最小值同时标志点begin和end向内移动,直到两者相遇,说明排序已经完成

值得注意的是,如果恰好第一个数据就是最大值,那么maxi将得不到最大值的下标,而此时我们先交换了最小值和头元素,作为头元素的最大值的下标便变成了mini所以要进行一次判断,如果最大值是头元素,就在交换了头元素和最小值之后,将mini赋值给maxi

选择排序的时间复杂度和空间复杂度:

  • 时间复杂度:O(N^2)
  • 空间复杂度:O(1)

3.堆排序

我们知道堆有大堆和小堆两个特性,而我们的堆排序则采用大堆化小堆来进行排序。

 我们默认一个堆按从上到下,从左到右的顺序为排序的顺序,这就要求我们要将更大的数据往堆的右下角去移动,所以要建小堆,但是单纯只是建个小堆,可能会出现下一层的元素大于上一层的情况

所以我们要先建大堆,这样可以使根节点为为最大值,然后再将根节点与堆的最右下角元素交换,然后再将剩下的元素继续调整为大堆,如此循环往复的去交换,便可实现排序。

源码如下:

//堆向下调整
void AdjustDown(int* a, int size, int parent)
{
	int child = parent * 2 + 1;
	while (child < size)
	{
		if (child + 1 < size && a[child + 1] > a[child])
		{
			child++;
		}
		if (a[child] > a[parent])
		{
			Swap(&a[child], &a[parent]);
			parent = child;
			child = parent * 2 + 1;
		}
		else
		{
			break;
		}
	}
}
//堆排序
void HeapSort(int* a, int n)
{
	//建大堆
	for (int i = (n - 1 - 1) / 2; i >= 0; i--)
	{
		AdjustDown(a, n, i);
	}
	//排序
	int end = n - 1;
	while (end > 0)
	{
		Swap(&a[0], &a[end]);
		AdjustDown(a, end, 0);
		end--;
	}
}

堆排序的时间复杂度和空间复杂度:

  • 时间复杂度O(N*logN)
  • 空间复杂度O(1)

4.插入排序

插入排序的原理是从第二个数据开始依次去和它前边的数据比较,如果前边的数据比它大,就进行交换,并继续向前比较,直到前边的数据比它小为止

源码入下:

void InsertSort(int* a, int n)
{
    for (int i = 0; i < n - 1; i++)
    {
        int end = i;
        int tmp = a[end + 1];
        while (end >= 0)
        {
            if (tmp < a[end])
            {
                a[end + 1] = a[end];
                --end;
            }
            else
                break;
        }
        a[end + 1] = tmp;
    }
}

 插入排序的时间复杂度和空间复杂度:

  • 时间复杂度:O(N^2)
  • 空间复杂度:O(1)

5.希尔排序

希儿排序实际上是对插入排序的一种优化:先选定一个整数n把待排序数据分成个若干组,所有距离为n的数据在同一组内,并对每一组内的数据进行排序。然后,取更小的整数n重复上述分组和排序的工作。直到当n == 1时,所有数据在同一组内进行一次插入排序

数据结构——排序_第2张图片

源码如下:

void ShellSort(int* a, int n)
{
	int gap = n;
	//gap > 1是预排序,目的是让数据接近有序
	//gap = 1是直接插入排序,目的是让数据有序
	while (gap > 1)
	{
		gap = gap / 3 + 1;
		for (int i = 0; i < n - gap; i++)
		{
			int end = i;
			int tmp = a[end + gap];
			while (end >= 0)
			{
				if (tmp < a[end])
				{
					a[end + gap] = a[end];
					end -= gap;
				}
				else
					break;
			}
			a[end + gap] = tmp;
		}
	}
}

 gap即为所需要的整数,一般情况下,先让他等于数据长度,然后每次排序时都除以3再+1。这个并不固定,只要能保证最后gap要为1即可。

希尔排序的时间复杂度和空间复杂度:

  •  时间复杂度:平均为O(N^1.3)
  • 空间复杂度:平均为O(1)

6.快速排序

先来看动图:

数据结构——排序_第3张图片

默认第一个元素为key位,然后头尾两个“先锋兵”开始行动,其中R先向左移动,去找到比key小的值并停下,然后L开始向右移动,找到比key大的值并停下,然后交换L和R所在位置的值,并让R开始继续移动,重复上述操作直到R和L相遇,交换相遇点与key的值,并让相遇点成为新的key

如此操作之后,我们不难看出最后key的左边的值都比key小,而右边的值都比key大。这样我们就唯一确定了key的位置。随后我们就需要去分别排序key的左半段和右半段了,很显然,这需要用到递归

源码如下:

void QuickSort(int* a, int begin, int end)
{
	if (begin >= end)
		return;
	int left = begin;
	int right = end;
	int key = begin;
	while (left < right)
	{
		while (left < right && a[right] >= a[key])
		{
			right--;
		}
		while (left < right && a[left] <= a[key])
		{
			left++;
		}
		Swap(&a[left], &a[right]);
	}
	Swap(&a[left], &a[key]);
	key = left;
	QuickSort(a, begin, key - 1);
	QuickSort(a, key + 1, end);
}

快速排序的时间复杂度和空间复杂度:

  • 时间复杂度O(N*logN)
  • 空间复杂度O(N*logN~O(N))

7.归并排序

先看动图:

 数据结构——排序_第4张图片

不难看出,归并排序也是类似于一组一组的排完序后再整体进行排序

假设我们将数据不断拆分为4组,每个小组内部先进行排序,而后1,2组排序,3,4组排序,最后排完序的两组在整体排序

很显然,这样的排序方式同样需要用到递归,而且用一个数组是无法完成的,所以我们需要新建一个数组进行排序,再将排好的数据拷贝回去

源码如下:

void _MergeSort(int* a, int begin, int end, int* tmp)
{
	if (begin >= end)
		return;
	int mid = (begin + end) / 2;

	_MergeSort(a, begin, mid, tmp);
	_MergeSort(a, mid + 1, end, tmp);

	int begin1 = begin, end1 = mid;
	int begin2 = mid + 1, end2 = end;
	int i = begin;
	while (begin1 <= end1 && begin2 <= end2)
	{
		if (a[begin1] < a[begin2])
			tmp[i++] = a[begin1++];
		else
			tmp[i++] = a[begin2++];
	}
	while (begin1 <= end1)
	{
		tmp[i++] = a[begin1++];
	}
	while (begin2 <= end2)
	{
		tmp[i++] = a[begin2++];
	}
	memcpy(a + begin, tmp + begin, sizeof(int) * (end - begin + 1));
}
void MergeSort(int* a, int n)
{
	int* tmp = (int*)malloc(sizeof(int) * n);
	if (tmp == NULL)
	{
		perror("MergeSort->malloc");
		exit(-1);
	}
	
	_MergeSort(a, 0, n - 1, tmp);
	free(tmp);
}

 定义mid将数据拆分为两组进行两组之间的排序,将排好的顺序记录在新数组tmp中,最后再利用memcpy拷贝回数组a中

值得注意的是,在每个子递归函数中,所递归的数据的头都是begin,尾是end,所以拷贝时要注意地址以及长度的写法

归并排序的时间复杂度和空间复杂度:

  • 时间复杂度:O(N*logN)
  • 空间复杂度:O(N)

三.总结

七大排序的基础知识到这里就介绍完啦,而数据结构初阶的知识到这里也全部落下帷幕啦

喜欢博主文章的小伙伴记得一键三连哦!

点关注不迷路,博主带你玩转编程!

你可能感兴趣的:(数据结构,排序算法)