说到排序,我们开始之前先来了解了解排序的一些相关的概念:
排序:所谓排序,就是将一个数据元素(或记录)的任意序列,重新排列成一个按关键字有序的序列。
排序还可以分为内部排序和外部排序:
内部排序:数据元素全部放在内存中的排序。
外部排序:数据元素太多不能同时放在内存中,根据排序过程的要求不能在内外存之间移动数据的排序
这里我们还需要理解一个概念
稳定性:假定在待排序的记录序列中,存在多个具有相同的关键字的记录,若经过排序,这些记录的相对次
序保持不变,即在原序列中,r[i]=r[j],且r[i]在r[j]之前,而在排序后的序列中,r[i]仍在r[j]之前,则称这种排
序算法是稳定的;否则称为不稳定的。
排序在实际生活中随处可见:比如大学的排名,企业排名,商品价格的排序等等。(以下是网上找的图片)
直接插入排序是一种简单的插入排序法,其基本思想是:待排序的记录按其关键码值的大小逐个插入到一个已经排好序的有序序列中,直到所有的记录插入完为止,得到一个新的有序序列 。 插入排序的代码实现虽然没有冒泡排序那么简单粗暴,但它的原理应该是最容易理解的了,因为只要打过扑克牌的人都应该能够秒懂
当插入第i(i>=1)个元素时,前面的array[0],array[1],…,array[i-1]已经排好序,此时用array[i]的排序码与array[i-1],array[i-2],…的排序码顺序进行比较,找到插入位置即将array[i]插入,原来位置上的元素顺序后移
void Print(int* a, int n)
{
for (int i = 0; i < n; i++)
{
printf("%d ", a[i]);
}
printf("\n");
}
void InsertSort(int* a, int n)
{
for (int i = 0; i < n - 1; i++)
{
int end = i;
int tmp = a[end + 1];
while (end >= 0)
{
if (a[end] > tmp)
{
a[end + 1] = a[end];
--end;
}
else
{
break;
}
}
a[end + 1] = tmp;
}
}
void TestInsertSort()
{
int a[] = { 5,8,2,50,7,-1,100,66 };
int n = sizeof(a) / sizeof(a[0]);
InsertSort(a, n);
Print(a, n);
}
int main()
{
TestInsertSort();
}
直接插入排序的特性总结:
2.2.1基本思想
希尔排序法又称缩小增量法。希尔排序法的基本思想是:先选定一个整数,把待排序文件中所有记录分成整数个组,所有距离为相同的记录分在同一组内,并对每一组内的记录进行排序。然后,重复上述分组和排序的工作。当到达=1时所有记录在统一组内排好序
2.2.2代码实现
void Print(int* a, int n)
{
for (int i = 0; i < n; i++)
{
printf("%d ", a[i]);
}
printf("\n");
}
void ShellSort(int* a, int n)
{
int gap=n;
while (gap > 1)
{
gap = gap / 3 + 1;
for (int i = 0; i < n - gap; i++)
{
int end = i;
int tmp = a[end + gap];
while (end >= 0)
{
if (a[end] > tmp)
{
a[end + gap] = a[end];
end -= gap;
}
else
{
break;
}
}
a[end + gap] = tmp;
}
}
}
void TestShellSort()
{
int a[] = { 5,8,2,50,7,-1,100,66 };
int n = sizeof(a) / sizeof(a[0]);
ShellSort(a, n);
Print(a, n);
}
int main()
{
TestShellSort();
}
希尔排序的特性总结:
希尔排序是对直接插入排序的优化。
当gap > 1时都是预排序,目的是让数组更接近于有序。当gap == 1时,数组已经接近有序的了,这样就
会很快。这样整体而言,可以达到优化的效果。我们实现后可以进行性能测试的对比。
希尔排序的时间复杂度不好计算,因为gap的取值方法很多,导致很难去计算,因此在好些书中给出的希尔排序的时间复杂度都不固定 (希尔排序的时间复杂度为O(N*logN))
《数据结构-用面相对象方法与C++描述》— 殷人昆
因为gap是按照Knuth提出的方式取值的,而且Knuth进行了大量的试验统计,我们暂时就按照:到 来算。
每一次从待排序的数据元素中选出最小(或最大)的一个元素,存放在序列的起始位置,直到全部待排序的数据元素排完
void Swap(int* p1, int* p2)
{
int tmp = *p1;
*p1 = *p2;
*p2 = tmp;
}
void SelectSort(int* a, int n)
{
int begin = 0;
int end = n - 1;
while (begin < end)
{
int mini = begin;
int maxi = begin;
for (int i = begin; i <= end; i++)
{
if (a[i] < a[mini])
{
mini = i;
}
if (a[i] > a[maxi])
{
maxi = i;
}
}
Swap(&a[begin], &a[mini]);
if (begin == maxi)
maxi = mini;
Swap(&a[end], &a[maxi]);
++begin;
--end;
}
}
void TestSelectSort()
{
int a[] = { 105,5,8,2,50,7,-1,100,66 };
int n = sizeof(a) / sizeof(a[0]);
SelectSort(a, n);
Print(a, n);
}
int main()
{
TestSelectSort();
}
直接选择排序的特性总结:
堆排序(Heapsort)是指利用堆积树(堆)这种数据结构所设计的一种排序算法,它是选择排序的一种。它是通过堆来进行选择数据。需要注意的是排升序要建大堆,排降序建小堆。
对于堆排序而言,我们首先要做的第一步就是建堆
建完堆之后,将最后一个数据与堆顶数据交换,然后将除最后一个数据之外的所有数据重新向下调整,直至完全升序。
我们以动图的形式展示整个过程:
关于堆排序前面的博客我们已经学过一遍了,这次再提一次。
void AdjustDown(int* a, int n, int parent)
{
//最小的默认为左孩子
int minchild = 2 * parent + 1;
while (minchild < n)
{
//找出小的那个孩子
if (minchild + 1 < n && a[minchild + 1] > a[minchild])
{
minchild++;
}
//小堆
if (a[minchild] > a[parent])
{
Swap(&a[minchild], &a[parent]);
parent = minchild;
minchild = 2 * parent + 1;
}
else
{
break;
}
}
}
void HeapSort(int* a, int n)
{
//建堆
for (int i = (n-1-1)/2; i>=0; i--)
{
AdjustDown(a, n, i);
}
//进行排序
int i = 1;
while (i < n)
{
Swap(&a[0], &a[n - i]);
AdjustDown(a, n - i, 0);
++i;
}
}
void TestHeapSort()
{
int a[] = { 105,5,8,2,50,7,-1,100,66 };
int n = sizeof(a) / sizeof(a[0]);
HeapSort(a, n);
Print(a, n);
}
int main()
{
TestHeapSort();
}
基本思想:所谓交换,就是根据序列中两个记录键值的比较结果来对换这两个记录在序列中的位置,交换排序的特点是:将键值较大的记录向序列的尾部移动,键值较小的记录向序列的前部移动
冒泡排序是我们最早接触的算法了,对于冒泡排序我们应该是最熟悉的了
void BubbleSort(int* a, int n)
{
for (int i = 0; i < n; i++)
{
int flag = 0;
for (int j = 0; j < n - 1 - i; j++)
{
if (a[j] > a[j + 1])
{
Swap(&a[j], &a[j + 1]);
flag = 1;
}
}
if (flag == 0)
{
break;
}
}
}
void TestBubbleSort()
{
int a[] = { 105,5,8,2,50,7,-1,100,66 };
int n = sizeof(a) / sizeof(a[0]);
BubbleSort(a, n);
Print(a, n);
}
int main()
{
TestBubbleSort();
}
快速排序是Hoare于1962年提出的一种二叉树结构的交换排序方法,其基本思想为:任取待排序元素序列中的某元素作为基准值,按照该排序码将待排序集合分割成两子序列,左子序列中所有元素均小于基准值,右子序列中所有元素均大于基准值,然后最左右子序列重复该过程,直到所有元素都排列在相应位置上为止 。
简单来说,就是左边比基准值小,右边比基准值大(基准值我们一般选取最左边的值、中间的值、最右边的值,或者随机值)选取最左边的值的话,让右边先走,选取最右边的值的话,让左边先走
很明显,我们可以利用递归来实现快排。快速排序这部分我们会说的比较多。
hoare版本
下面,进行代码实现:
//单趟排序
int PartSort(int* a, int left, int right)
{
int keyi = left;
while (left < right)
{
//R找小(记得给等于号,不然会造成死循环)
while (left<right && a[right] >= a[keyi])
{
--right;
}
//L找大
if (left<right && a[left] <= a[keyi])
{
++left;
}
if(left<right)
Swap(&a[left], &a[right]);
}
int meeti = left;
Swap(&a[left], &a[keyi]);
return meeti;
}
void QuickSort(int* a, int begin,int end)
{
int keyi = PartSort(a, begin, end);
if (begin >= end)
return;
QuickSort(a, begin, keyi - 1);
QuickSort(a, keyi + 1, end);
}
void TestQuickSort()
{
int a[] = { 105,5,8,2,50,7,-1,100,66 };
int n = sizeof(a) / sizeof(a[0]);
QuickSort(a, 0,n-1);
Print(a, n);
}
int main()
{
TestQuickSort();
}
但是,对于hoare版本,我们还可以对其进行优化:
在比较理想的情况下,我们选择key单趟排完基本都是在中间,这样子才是二分logN O(N*logN)
如果在有序/接近有序的情况下,那么key每次单趟排完的效果是比较差的O(N^2),所以下面进入快排的另一个主题,优化问题
2.递归到小的子区间时,可以考虑使用插入排序
下面,我们用代码来实现三数取中的算法:
//三数取中
int GetMidIndex(int* a, int left, int right)
{
int mid = left + (right - left) / 2;
if (a[left] < a[mid])
{
if (a[mid] < a[right])
{
return mid;
}
else if (a[left] > a[right])
{
return left;
}
else
{
return right;
}
}
else
{
if (a[mid] > a[right])
{
return mid;
}
else if (a[right] > a[left])
{
return left;
}
else
{
return right;
}
}
}
下面,我们就可以优化我们的快排代码了:
//三数取中
int GetMidIndex(int* a, int left, int right)
{
int mid = left + (right - left) / 2;
if (a[left] < a[mid])
{
if (a[mid] < a[right])
{
return mid;
}
else if (a[left] > a[right])
{
return left;
}
else
{
return right;
}
}
else
{
if (a[mid] > a[right])
{
return mid;
}
else if (a[right] > a[left])
{
return left;
}
else
{
return right;
}
}
}
//单趟排序
int PartSort(int* a, int left, int right)
{
//三数取中
int mid = GetMidIndex(a, left, right);
Swap(&a[left], &a[mid]);
int keyi = left;
while (left < right)
{
//R找小(记得给等于号,不然会造成死循环)
while (left < right && a[right] >= a[keyi])
{
--right;
}
//L找大
if (left < right && a[left] <= a[keyi])
{
++left;
}
if (left < right)
Swap(&a[left], &a[right]);
}
int meeti = left;
Swap(&a[left], &a[keyi]);
return meeti;
}
void QuickSort(int* a, int begin, int end)
{
int keyi = PartSort(a, begin, end);
if (begin >= end)
return;
//小区间优化
if (end - begin <= 8)
{
InsertSort(a+begin,end-begin+1);
}
else
{
QuickSort(a, begin, keyi - 1);
QuickSort(a, keyi + 1, end);
}
}
挖坑法
简单来说,就是对单趟排序进行改造,三数取中后我们还是以左边作为key,然后把左边作为坑,然后右边找小,在把找到的值放在坑位上去,在把坑位置为右边找到的位置。再从左边找大,把找到的值放在坑位上,在更新一下坑位。重复以上过程。整体思路与hoare方法类似。
int PartSort2(int* a, int left, int right)
{
int mid = GetMidIndex(a, left, right);
Swap(&a[left], &a[mid]);
int key = a[left];
int hole = left;
while (left < right)
{
while (left<right && a[right]>=key)
{
--right;
}
a[hole] = a[right];
hole = right;
while (left < right && a[left] <=key)
{
++left;
}
a[hole] = a[left];
hole = left;
}
a[hole] = key;
return hole;
}
void QuickSort(int* a, int begin, int end)
{
int keyi = PartSort2(a, begin, end);
if (begin >= end)
return;
//小区间优化
if (end - begin <= 8)
{
InsertSort(a+begin,end-begin+1);
}
else
{
QuickSort(a, begin, keyi - 1);
QuickSort(a, keyi + 1, end);
}
}
下面,我们以动图的形式演示前后指针版本的过程:
代码实现:
//前后指针法
int PartSort3(int* a, int left, int right)
{
int mid = GetMidIndex(a, left, right);
Swap(&a[left], &a[mid]);
int keyi = left;
int prev = left;
int cur = left + 1;
while (cur<=right)
{
if (a[cur] < a[keyi]&&++prev!=cur)
{
Swap(&a[cur], &a[prev]);
}
++cur;
}
Swap(&a[keyi], &a[prev]);
return prev;
}
void QuickSort(int* a, int begin, int end)
{
int keyi = PartSort3(a, begin, end);
if (begin >= end)
return;
//小区间优化
if (end - begin <= 8)
{
InsertSort(a+begin,end-begin+1);
}
else
{
QuickSort(a, begin, keyi - 1);
QuickSort(a, keyi + 1, end);
}
}
至此,我们对于快排基本了解完了,这里还有另一点:那就是快速排序的非递归实现:
我们需要借助一个栈,对于栈,C语言我们肯定要自己去实现,栈的实现可参考我之前写过的博客,这里就直接来用了:
int PartSort3(int* a, int left, int right)
{
int mid = GetMidIndex(a, left, right);
Swap(&a[left], &a[mid]);
int keyi = left;
int prev = left;
int cur = left + 1;
while (cur<=right)
{
if (a[cur] < a[keyi]&&++prev!=cur)
{
Swap(&a[cur], &a[prev]);
}
++cur;
}
Swap(&a[keyi], &a[prev]);
return prev;
}
void QuickSortNonR(int* a, int begin, int end)
{
ST st;
StackInit(&st);
StackPush(&st, begin);
StackPush(&st, end);
while (!StackEmpty(&st))
{
int right = StackTop(&st);
StackPop(&st);
int left = StackTop(&st);
StackPop(&st);
if (left >= right)
{
continue;
}
int keyi = PartSort3(a, left, right);
//[left,keyi-1] keyi [keyi+1,right]
//先入右边
StackPush(&st, keyi+1);
StackPush(&st, right);
//后入左边
StackPush(&st, left);
StackPush(&st, keyi-1);
}
StackDestory(&st);
}
至此,我们终于把快速排序的大部分内容说完了。
快速排序的特性总结:
啃完了快速排序之后,还有另一个重要的排序:归并排序
归并排序(MERGE-SORT)是建立在归并操作上的一种有效的排序算法,该算法是采用分治法(Divide andConquer)的一个非常典型的应用。将已有序的子序列合并,得到完全有序的序列;即先使每个子序列有序,再使子序列段间有序。若将两个有序表合并成一个有序表,称为二路归并。 归并排序核心步骤
void _MergeSort(int* a, int left, int right,int*tmp)
{
if (left >= right)
return;
int mid = left + ((right - left) >>1);
//进行分治
_MergeSort(a, left, mid, tmp);
_MergeSort(a, mid + 1, right, tmp);
//进行归并
int begin1 = left, end1 = mid;
int begin2 = mid + 1, end2 = right;
//归并的可不一定是0
int index = left;
while (begin1 <= end1 && begin2 <= end2)
{
if (a[begin1] < a[begin2])
{
tmp[index++] = a[begin1++];
}
else
{
tmp[index++] = a[begin2++];
}
}
while (begin1 <= end1)
{
tmp[index++] = a[begin1++];
}
while (begin2 <= end2)
{
tmp[index++] = a[begin2++];
}
//将数据拷贝回原数组
for (int i = left; i <= right; i++)
{
a[i] = tmp[i];
}
}
void MergeSort(int* a, int n)
{
int* tmp = (int*)malloc(sizeof(int) * n);
_MergeSort(a, 0, n - 1, tmp);
free(tmp);
}
void TestMergeSort()
{
int a[] = { 105,5,8,2,50,7,-1,100,66 };
int n = sizeof(a) / sizeof(a[0]);
MergeSort(a,n);
Print(a, n);
}
int main()
{
TestMergeSort();
}
归并排序的特性总结:
void MergeSortNonR(int* a, int n)
{
int* tmp = (int*)malloc(sizeof(int) * n);
if (NULL == tmp)
{
perror("malloc fail");
exit(-1);
}
else
{
//每组数组的个数
int gap = 1;
while (gap < n)
{
for (int i = 0; i < n; i += 2 * gap)
{
//[i,i+gap-1] [i+gap,i+2*gap-1]
int begin1 = i, end1 = i + gap - 1;
int begin2 = i + gap, end2 = i + 2 * gap - 1;
//进行边界修正
if (begin2 >= n)
break;
if (end2 >= n)
{
end2 = n - 1;
}
int index = i;
while (begin1 <= end1 && begin2 <= end2)
{
if (a[begin1] < a[begin2])
{
tmp[index++] = a[begin1++];
}
else
{
tmp[index++] = a[begin2++];
}
}
while (begin1 <= end1)
{
tmp[index++] = a[begin1++];
}
while (begin2 <= end2)
{
tmp[index++] = a[begin2++];
}
//将数据拷贝回原数组
for (int j = i; j <=end2; j++)
{
a[j] = tmp[j];
}
}
gap *= 2;
}
}
}
void TestMergeSortNonR()
{
int a[] = { 105,5,8,2,50,7,-1,100,66 };
int n = sizeof(a) / sizeof(a[0]);
MergeSortNonR(a, n);
Print(a, n);
}
int main()
{
TestMergeSortNonR();
}
归并排序的特性总结:
思想:计数排序又称为鸽巢原理,是对哈希直接定址法的变形应用
操作步骤:
代码实现:
void CountSort(int* a, int n)
{
int max = a[0], min = a[0];
for (int i = 0; i < n; ++i)
{
if (a[i] > max)
{
max = a[i];
}
if (a[i] < min)
{
min = a[i];
}
}
int range = max - min + 1;
int* count = (int*)malloc(sizeof(int) * range);
if (count == NULL)
{
perror("malloc fail");
exit(-1);
}
else
{
memset(count, 0, sizeof(int) * range);
for (int i = 0; i < n; i++)
{
count[a[i]-min]++;
}
int j = 0;
for (int i = 0; i < range; i++)
{
while (count[i]--)
{
a[j++] = i + min;
}
}
}
free(count);
}
void TestCountSort()
{
int a[] = { 105,5,8,2,50,7,-1,100,66 };
int n = sizeof(a) / sizeof(a[0]);
CountSort(a, n);
Print(a, n);
}
int main()
{
TestCountSort();
}
计数排序的特性总结:
终于,终于到这里了,这篇博客写了好久,说句掏心窝子的话,挺累的。
总结一下,我们学习了7种排序的方法,也介绍了时间复杂度和空间复杂度,还有稳定性,同时通过代码实现了排序。综合情况下,快排还是比较优的。