想快速入门数据结构,推荐订阅作者的初阶数据结构专栏!此专栏预计更新:顺序表,链表,栈,队列,二叉树,排序算法等等
初阶数据结构我们通过c语言实现,所以此专栏也可以帮助大家巩固大家的c语言知识
源代码已上传至我的码云
前言
非常感谢各位小伙伴的支持,我们的初阶数据结构系列在经过这篇文章后,也迎来了它的完结!
这个系列我们使用纯c语言实现了一些简单的数据结构,用它们解决了一些简单的问题
当年,可能有的小伙伴会问了:为啥作者没有收录图或者其它的数据结构啊?
别急,作者在下个月开始后,会开一个c++的新坑,不仅会介绍基础语法,还会介绍一些类啊,STL和一些只能使用c++实现的数据结构,感谢各位小伙伴的持续关注哦!
毕竟,c语言还是有局限性的,使用c语言来写会非常麻烦
好!接下来开始我们今天的内容!
我们在生活中,会遇到各种各样的排序
比如我们在淘宝进行网购的时候
我们网购手机,将价格啊,销量啊进行排序,方便我们对商品的筛选
大家应该好奇了,这种排序在背后是咋实现的啊?别担心,今天我帮你们揭开排序神秘的面纱
排序算法按数据交互方式分,可分为以下几种
一种简单的插入算法,基本思想:
把待排序数据关键字插入到一个有序序列中的特定位置
画图求解:
我们从后往前检查,3-6都比2大,当发现1比2小了的时候,将2插入到1的后面
具体操作方法:
我们学过顺序表的插入,知道如果要插入数据的话,最好挪动关键字位置后面的数据,防止数据的覆盖
单趟排序的演示:
将已经排好序的序列的末尾开始,往后面扫描,当发现比待排序关键字小的数据后,挪动后面的数据,将待排序插入到选定数据的后面
动图演示:
int end = i;//有序序列的末尾
int x = a[end + 1];//待排序
while (end >= 0)
{
if (a[end] > x)
{
a[end + 1] = a[end];//挪动数据
end--;
}
else
{
break;
}
}
a[end + 1] = x;//插入
将其组合为插入排序?
我们可以从前往后遍历待排序数组,将已经遍历的数组看做是有序数组,而后面的数据是我们待排序的数据
动图展示:
void InsertSort(int* a, int n)
{
assert(a);
for (int i = 0; i < n - 1; i++)
{
int end = i;
int x = a[end + 1];
while (end >= 0)
{
if (a[end] > x)
{
a[end + 1] = a[end];
end--;
}
else
{
break;
}
}
a[end + 1] = x;
}
}
性能分析:
时间复杂度:O(n2),最坏情况为逆序,扫描数组需要n次,而挪动数据又需要n次
空间复杂度:O(1)
而在最好情况,复杂度为O(n),有序数组的情况
而我们可以利用在有序或者接近有序的情况下,插入排序效率较高这一特征,对插入排序进行优化,而这个优化方式就叫希尔排序
希尔排序是对插入排序的优化,此排序算法分为以下两个阶段:
这个算法的重点就是预排序过程,
以下是预排序的思路:
选定一个整数gap,把待排序数组按每gap一步分组进行排序,对每一组的数据进行排序
重复,当gap=1时,就变成了直接插入排序
例如,当gap=5时的分组
gap=2时
这样的预处理,我们可以使序列尽量有序,可以将较大的数据尽快挪动在数组末尾
例如,将gap=2进行预排序(单趟)
其实与插入的思想相同,插入是一次挪动1个数据,这里1次挪动gap数据(也就是将gap=2组直接看做一个序列进行插入排序)
int end = i;//将插排的1换成了gap,其它无差别
int x = a[end + gap];
while (end >= 0)
{
if (a[end] > x)
{
a[end + gap] = a[end];
end -= gap;
}
else
{
break;
}
}
a[end + gap] = x;
而我们要完成预排序的操作时,可以用插排的思想,遍历数组,对齐进行组间交叉的预排序
而gap我们可以逐渐减小,作者这里是每次将gap/3,直到gap为1时,进行插入排序
代码实现
void ShellSort(int* a, int n)
{
assert(a);
int gap = n;
while (gap > 1)
{
gap = gap / 3 + 1;
for (int i = 0; i < n - gap; i++)
{
int end = i;
int x = a[end + gap];
while (end >= 0)
{
if (a[end] > x)
{
a[end + gap] = a[end];
end -= gap;
}
else
{
break;
}
}
a[end + gap] = x;
}
}
}
性能分析:
时间复杂度:O(n1.5)大约,因为希尔排序的时间复杂度不太好算
空间复杂度:O(1)
一个非常好理解的排序
我们可以定义两个指针,寻找最大值和最小值,再与左端和右端进行交换
动图展示:
void SelectSort(int* a, int n)
{
assert(a);
int begin = 0;
int end = n - 1;
while (begin < end)
{
int imax = begin;
int imin = begin;
for (int i = begin; i <= end; i++)
{
if (a[i] > a[imax])
{
imax = i;
}
if(a[i] < a[imin])
{
imin = i;
}
}
Swap(&a[begin], &a[imin]);
if (imax == begin)
imax = imin;//这里是防止imax被换走,对imax进行修正
Swap(&a[end], &a[imax]);
begin++;
end--;
}
}
时间复杂度:O(n2),无论什么情况都是O(n2)
空间复杂度:O(1)
我们在这篇文章中讲到了堆的实现,而堆的重要应用就是排序,点我直达文章
堆排序的步骤:
建大堆,我们可以方便选出每次待排序序列中的最大元素,方便与最后一个元素交换
过程演示:
void HeapSortDown(int* a, int n)
{
assert(a);
int i = 0;
for (i = (n - 1 - 1) / 2; i >= 0; i--)
{
AdjustDown(a, n , i);
}//建堆操作
for (i = n - 1; i > 0; i--)
{
Swap(&a[0], &a[i]);
AdjustDown(a, i, 0);
}//调整最大元素
}
时间复杂度:O(n*logn),建堆消耗O(n),调整执行树的高度次,也就是(logn)次
空间复杂度:O(1)
冒泡排序是我们在初学c语言时就接触到的一种简单的排序算法
基本思想是:
每次通过两两相邻的元素交换,将最大的元素交换到数组的末尾,就想冒泡一样把最大元素冒在上面
动图演示:
我们可以定义一个标记变量,当我们遍历时没有发生交换操作,(即数组已经有序)则直接跳出循环
void BubbleSort(int* a, int n)
{
assert(a);
int end = n;
while (end >= 0)
{
int flag = 0;
for (int i = 0; i < end - 1; i++)
{
if (a[i] > a[i + 1])
{
flag = 1;
Swap(&a[i], &a[i + 1]);
}
}
end--;
if (!flag)
break;
}
}
时间复杂度:O(n2),但有序情况下复杂度为O(n)
空间复杂度:O(1)
**注意,划重点!**本文最重要的知识点,没有之一
快速排序是一种二叉树结构交换算法,基本思想是:任取一个待排序中的基准值(key)(本文取数组的最左边),通过交换操作,使序列左边的值比基准值小,而右边的值比基准值大,然后左右子列重复过程,直到整个序列有序
基本思想图解
所以,类似于二叉树,快速排序也使用递归实现
其中,交换方式有三种
这个方式是最开始发明快速排序的人提出的
步骤是:
先标记序列的最左边和最右边,从选定key位置相反一端开始遍历,本文也就是右端向左走,右端找到比key小的元素后停止,左边找到比key大的元素后停止,同时停止后交换,直到它们相遇,在相遇位置赋予关键字的值
这样,就能实现我们单趟排序的目的:左比key小右比key大
动图演示
int Partion1(int* a, int left, int right)
{
int key = left;
while (left < right)
{
while (left < right && a[right] >= a[key])
{
right--;
}
while (left < right && a[left] <= a[key])
{
left++;
}
Swap(&a[left], &a[right]);
}
Swap(&a[left], &a[key]);
return left;
}
其中while里面的while中的left
其中a[right]>=a[key]中的>=是防止重复序列(55555)而出现死循环
基本思想是:
遍历方式同上,将key保存下来,并将key的位置设置为一个坑,右边找到符合要求的数后,将它放在坑里面,并将符合要求的数设为一个新坑,然后左右重复操作,直到它们相遇,把key放入它们的相遇位置
动图:
int Partion2(int* a, int left, int right)
{
int key = a[left];
int pivot = left;
while (left < right)
{
if (left < right && a[right] >= key)
{
right--;
}
a[pivot] = a[right];
pivot = right;
if (left < right && a[left] <= key)
{
left++;
}
a[pivot] = a[left];
pivot = left;
}
a[pivot] = key;
return pivot;
}
基本思想:定义prev和cur。将prev放在key位置,cur初始在prev前一格
cur找比key小的数,找到后先++prev,再交换它们,如果遍历到不满足要求的数组,直接走cur
要达到的目的就是利用cur把较小数往左翻,prev把大序列往右推
动图演示:
int Partion3(int* a, int left, int right)
{
int key = left;
int prev = left;
int cur = prev + 1;
while (cur <= right)
{
if (a[cur] < a[key] && ++prev != cur)//prev和cur相等不用交换
{
Swap(&a[cur], &a[prev]);
}
cur++;
}
Swap(&a[prev], &a[key]);
return prev;
}
如何把它们变的有序?
使用递归
每次将相遇位置保保存,然后对[left,key-1]和[key+1,right]继续此操作
void QuickSort(int* a, int left, int right)
{
assert(a);
if (left >= right)
return;
int key = Partion1(a, left, right);
QuickSort(a, left, key - 1);//递归左序列
QuickSort(a, key + 1, right);//递归右序列
}
首先,如果我们要排的是有序序列,我们的算法效率会非常低
直接到O(n2)
因为如果是12345,拿左边做key,每次就相当于要遍历一个数组但又没有任何操作,然后递归拿2接着遍历,又没有任何操作
为了解决这个问题,我们引入了三数取中法
从左,右,中间选出一个不是最大又不是最小的数字交换到左边做新的key
int GetMidIndex(int* a, int left, int right)
{
int mid = (left + right) / 2;
if (a[left] < a[right])
{
if (a[mid] < a[left])
{
return left;
}
else if (a[mid] > a[right])
{
return right;
}
else
{
return mid;
}
}
else
{
if (a[mid] < a[right])
{
return right;
}
else if (a[mid] > a[left])
{
return left;
}
else
{
return mid;
}
}
}
下一个问题是,小区间的递归层数可能会非常多,这会影响算法效率
可以设想一颗二叉树,最多的结点是叶子结点,类比于小区间
我们可以在小区间使用插入排序,而不是快速排序,小区间通常是n<10的时候
这叫做小区间优化
void QuickSort(int* a, int left, int right)
{
assert(a);
if (left >= right)
return;
int key = Partion3(a, left, right);
if (right - left + 1 < 10)
{
InsertSort(a + left, right - left + 1);
}//小区间优化
QuickSort(a, left, key - 1);
QuickSort(a, key + 1, right);
}
递归总是有一个问题:如果递归深度很大,会导致栈溢出
为了解决这个问题,我们可以使用非递归实现
其中,我们如果想把递归改为非递归,有两种方法可以实现,改为循环和模拟栈实现
这里我们使用模拟栈来实现
利用栈,来保存我们要操作的区间
我们可以将区间入在栈当中,然后拿到区间后开始操作,再把[left,key-1]和[ket+1,right]分别入在栈中,重复,直到栈为空
void QuickSortNonR(int* a, int left, int right)
{
assert(a);
ST st;
StackInit(&st);
StackPush(&st, left);
StackPush(&st, right);
while (!StackEmpty(&st))
{
int end = StackTop(&st);//区间右端
StackPop(&st);
int begin = StackTop(&st);//区间左端
StackPop(&st);
int key = Partion3(a, begin, end);//对区间进行单趟排序
if (end > key + 1)
{
StackPush(&st, key + 1);
StackPush(&st, end);
}//如果区间存在,则入栈
if (begin < key - 1)
{
StackPush(&st,begin);
StackPush(&st, key - 1);
}//如果区间存在,则入栈
}
StackDestory(&st);
}
时间复杂度:O(n*logn)
空间复杂度:O(logn)(此为函数递归开辟的额外空间)
基本思想是:
我们可以把两个有序数组进行合并,合并成一个新的有序大数组
所以我们使用分治思想,将待排序数组分成两个数组,不断往下分,即将每个子序列有序,再使子序列段间有序
void _MergeSort(int* a, int left, int right, int* tmp)
{
if (left >= right)
return;
int mid = (left + right) / 2;
_MergeSort(a, left, mid, tmp);
_MergeSort(a, mid + 1, right, tmp);//递归分解子区间
int begin1 = left;
int end1 = mid;
int begin2 = mid + 1;
int end2 = right;
int i = left;//不是0
while (begin1 <= end1 && begin2 <= end2)//归并操作
{
if (a[begin1] < a[begin2])
{
tmp[i++] = a[begin1++];
}
else
{
tmp[i++] = a[begin2++];
}
}
while (begin1 <= end1)
{
tmp[i++] = a[begin1++];
}
while (begin2 <= end2)
{
tmp[i++] = a[begin2++];
}
for (int j = left; j <= right; j++)
{
a[j] = tmp[j];
}
}
void MergeSort(int* a, int n)
{
assert(a);
int* tmp = malloc(sizeof(int) * n);
if (!tmp)
{
printf("malloc fail\n");
exit(-1);
}
_MergeSort(a, 0, n - 1, tmp);
free(tmp);
tmp = NULL;
}
时间复杂度:O(n*logn)
空间复杂度:O(n)(开辟了临时数组用于归并)
因为归并排序使用了递归,同样有栈溢出的风险,所以我们需要掌握非递归的写法
我们还是拿上面的数组举例【10,6,7,1,3,9,4,2】
同样,递归改递归要么用栈和队列,要么用循环
这个排序递归改成非递归用循环比较合适
它的基本思路是这样的:
同样还是跟递归一样的分法,要把它们不断细分为小组逐步进行归并,这里我们可以使用gap进行归并,控制循环变量i走的步数长度不一样来控制我们小组的长度
初始将gap设置为1,每次遍历将i走2*gap步(代表两组之间的合并)
于是我们需要归并的区间为[i,i+gap-1]和[i+gap,i+2*gap-1]这两个区间
具体归并步骤与上面一样,不再阐述
动图演示:
至于把临时数组拷贝回原数组的问题,我们每归并一组,就拷贝一组,防止临时数组越界
代码如下:
void MergeSortNonR(int* a, int n)
{
assert(a);
int* tmp = malloc(sizeof(int) * n);
if (!tmp)
{
printf("malloc fail\n");
exit(-1);
}
int gap = 1;
while (gap < n)
{
for (int i = 0; i < n; i += 2 * gap)
{
int begin1 = i, end1 = i + gap - 1;
int begin2 = i + gap, end2 = i + 2 * gap - 1;
int index = i;
while (begin1 <= end1 && begin2 <= end2)//归并操作
{
if (a[begin1] < a[begin2])
{
tmp[index++] = a[begin1++];
}
else
{
tmp[index++] = a[begin2++];
}
}
while (begin1 <= end1)
{
tmp[index++] = a[begin1++];
}
while (begin2 <= end2)
{
tmp[index++] = a[begin2++];
}
for (int j = i; j <= end2; j++)//拷贝
{
a[j] = tmp[j];
}
}
gap *= 2;
}
}
你以为这么就完了?你太天真了!
大家想想,我们要排这样的数据怎么办?
【10,6,7,1,3,9,4,2,3】
【10,6,7,1,3,9,4,2,11,3】
【10,6,7,1,3,9,4,2,3,11,14】
大家应该发现了,这样的数据,它的有些区间可能不存在!
处理方式也很简单,不是要越界吗,我把越界的区间修正一下就行了
但是,不同的情况需要不同讨论,这里有以下三种情况
前两种情况,就代表是有一个落单的数据和落单的一组在那里找不到归并的对象,处理方式比较简单,直接跳出循环,不要它们进行归并就行
最后一种情况,一般是代表前面的数据已经排好了,只剩最后一个数或者一个组无法进入整体排序没有排,这时候我们需要调整区间的范围,把end2调整到范围内就行,不会影响归并
完整代码:
void MergeSortNonR(int* a, int n)
{
assert(a);
int* tmp = malloc(sizeof(int) * n);
if (!tmp)
{
printf("malloc fail\n");
exit(-1);
}
int gap = 1;
while (gap < n)
{
for (int i = 0; i < n; i += 2 * gap)
{
int begin1 = i, end1 = i + gap - 1;
int begin2 = i + gap, end2 = i + 2 * gap - 1;
int index = i;
if (end1 >= n || begin2 >= n)
{
break;
}
if (end2 >= n)
{
end2 = n - 1;
}
while (begin1 <= end1 && begin2 <= end2)
{
if (a[begin1] < a[begin2])
{
tmp[index++] = a[begin1++];
}
else
{
tmp[index++] = a[begin2++];
}
}
while (begin1 <= end1)
{
tmp[index++] = a[begin1++];
}
while (begin2 <= end2)
{
tmp[index++] = a[begin2++];
}
for (int j = i; j <= end2; j++)
{
a[j] = tmp[j];
}
}
gap *= 2;
}
}
计数排序其实是哈希定址法的应用
思路:
遍历数组,找到最大值最小值,开辟range范围的空间(range=max-min+1)
统计数字出现次数,每出现一次在新开辟的空间的对应位置+1(对应位置:min+a[i](a[i]为此次数据))
回收数据
动图
void CountSort(int* a, int n)
{
assert(a);
int max = INT_MIN;
int min = INT_MAX;
for (int i = 0; i < n; i++)
{
if (a[i] > max)
{
max = a[i];
}
if (a[i] < min)
{
min = a[i];
}
}
int range = max - min + 1;
int* count = (int*)malloc(sizeof(int) * range);
if (!count)
{
printf("malloc fail\n");
exit(-1);
}
memset(count, 0, sizeof(int) * range);
for (int i = 0; i < n; i++)
{
count[a[i] - min]++;
}
int index = 0;
for (int i = 0; i < range; i++)
{
while (count[i])
{
a[index++] = i + min;
count[i]--;
}
}
free(count);
count = NULL;
}
我们在本篇文章中介绍的O(n^2)排序算法有三种:直接插入,直接选择,冒泡
我们通过对它们算法思想的比较,可以得出一些结论
直接选择在什么情况下都是O(n2),因为不管什么情况,计算机一定会选完所有的元素后才能得出最终结论
而插入排序在有序或者接近有序的情况下的效率可达O(n),比如像[1,3,2,4,5]这样的数组,插入排序只需要操作1(挪动数据)+2(检查后面的数据)次
冒泡排序虽然经过了改进,但需要遍历一次数组才能判断它是否真的有序,比如还是[1,3,2,4,5],冒泡在第一次排序后成了[1,2,3,4,5],但最后还要遍历一次才能判断它有序,所以冒泡效率不如直接插入
综上,在O(n2)排序中,直接插入排序的适应性更强
关于排序稳定性的概念:
在排序中,保持排序前关键字相同的数据在排序后的相对位置不变的,我们说这个排序是稳定的,否则是不稳定的
比如1,2,3,5,6,5,1我们就要保证在排序先后,前面的5始终在后面的5的前面,而不能改变它们的相对位置
稳定的排序有:冒泡排序,插入排序,归并排序
选择排序为什么不稳定?
5,4,1,5,0,9这个数组
把0与5交换位置后,5和5的相对位置发生了改变
希尔排序?
相同的值可能会在不同组中进行排序
堆排序?
全是相同的值的情况?
快速排序?
最左边与某一位置数据相等?