排序 的目的是将一段无序的记录序列调整为一段有序的记录序列。排序分为内部排序和外部排序两种。
内部排序:整个排序过程都在内存中完成,不需要访问外存。
外部排序:因需要排序的数据很大,一次不能容纳全部的排序记录,在排序过程中需要访问外存。
常见的内部排序算法有:插入排序、希尔排序、选择排序、冒泡排序、归并排序、快速排序、堆排序、基数排序等。
稳定性:是指假设在某一序列中存在两个或两个以上的记录具有相同的关键字,在用某种排序法排序后,若这些相同关键字的元素的相对次序任然不变,则这种排序方法是稳定的。其中冒泡,插入,基数,归并属于稳定排序,选择,快速,希尔,归属于不稳定排序。
目录
一、排序算法说明
二、排序算法详细介绍
1、冒泡排序
2、选择排序
3、插入排序
4、希尔排序
5、归并排序
6、快速排序
7、堆排序
8、计数排序
冒泡排序的核心思想:每次比较相邻的两个元素,如果它们的顺序错误就把他们互换。
举个栗子:比如我们想要将 10,9,22,15 这四个数从打到小排序,那么我们使用冒泡排序的排序过程就是,首先比较10和9,(9<10)不用互换,第一次比较后,序列变成(10,9,22,15),接着比较9和22,(9<22)那么9和22互换,第二次比较后序列变成(10,22,9,15),接着比较9和15,(9<15)那么9和15互换,第三次比较后序列变成(10,22,15,9)。经过这三次比较后,我们发现最小的已经归为了,这样我们称为“一趟”。接着我们进行第二趟,将第二小的数归为,首先我们比较10和22,(10<22)那么10和22互换,变成(22,10,15,9),接着10和15比较,(10<15)那么10和15互换,变成(22,15,10,9)因为我们在第一趟的时候已经计算出9是最小的了,所以10和9就不用再比较了。第二趟结束后此时的序列是(22,15,10,9),可能你发现这就排好了,不用在排了,其实计算机不知道有没有排好,它会接着第三趟,22与15比较,不用互换,然后排序完成,程序结束。这算是一次完整的冒泡排序过程。
#include
int main()
{
int a[10]={0};
int i,j;
int temp;
int n;
scanf("%d",&n); //输入n个数
for(i=0;i
当然你还可以对冒泡排序进行优化,就比如上面那个例子,第三趟可以不再进行,(其实这里的第三趟还是会进行,如果它还有第四趟,优化后,就不能进行了),优化很简单,添加一个标志就可以了。
#include
int main()
{
int a[10]={0};
int i,j;
int temp;
int n;
scanf("%d",&n);
for(i=0;i
选择排序的思路是:首先,找到数组中最小(大)的元素,拎出来,将它和数组的第一个元素交换位置,第二步,在剩下的元素中继续寻找最小(大)的元素,拎出来,和数组的第二个元素交换位置,如此循环,直到整个数组排序完成。
选择排序是一种简单直观的排序算法,无论什么数据进去都是 O(n²) 的时间复杂度。所以用到它的时候,数据规模越小越好。唯一的好处可能就是不占用额外的内存空间。
#include
int main()
{
int n,i,j,temp,a[10]={0};
scanf("%d",&n);
for(i=0;i
插入排序的思路是:首先,将未排序的序列的第一个元素看作一个有序序列,把从第二个元素开始直到最后一个元素看成未排序序列。然后,从头到尾依次扫描未排序序列,将扫描到的每个元素插入有序序列的适当位置。(如果待插入的元素与有序序列中的某个元素相等,则将待插入元素插入到相等元素的后面。)
#include
int main()
{
int n,i,j,k,temp,a[10]={0};
scanf("%d",&n);
for(i=0;i=0;j--) //在有序序列最右边开始比较,寻找比temp小的数
{
if(a[j]>temp)
a[j+1]=a[j];//此处要注意理解
else
break;
}
a[j+1]=temp;
}
for(i=0;i
希尔排序,也称递减增量排序算法,是插入排序的一种更高效的改进版本。但希尔排序是非稳定排序算法。
希尔排序是基于插入排序的以下两点性质而提出改进方法的:
希尔排序的基本思想是:先将整个待排序的记录序列分割成为若干子序列分别进行直接插入排序,待整个序列中的记录"基本有序"时,再对全体记录进行依次直接插入排序。
#include
void shell_sort(int a[],int len)
{
int gap,i,j;
int temp;
for(gap=len/2;gap>0;gap=gap/2)//可能你会问为什么区间要以gap=gap/2去计算,其实最优的区间计算方法是没有答案的,不过差不多都会取在二分之一到三分之一附近
{
for(i=gap;i=0;j=j-gap)//可以发现,当区间为1的时候,它使用的排序方式就是插入排序。
{
if(a[j]>temp)
a[j+gap]=a[j];
else
break;
}
a[j+gap]=temp;
}
}
}
int main()
{
int i,j,k,n,a[10]={0};
scanf("%d",&n);
for(i=0;i
在我们要了解归并排序,以及接下来的快速排序之前,我们必须了解什么是分治算法。他们都采用了分治的思想。
分治算法的基本思想就是:当我们求解某些问题时,由于这些问题要处理的数据相当多,或求解过程相当复杂,使得直接求解法在时间上相当长,或者根本无法直接求出。对于这类问题,我们往往先把它分解成几个子问题,找到求出这几个子问题的解法后,再找到合适的方法,把它们组合成求整个问题的解法。如果这些子问题还较大,难以解决,可以再把它们分成几个更小的子问题,以此类推,直至可以直接求出解为止。
在大概了解了上面是分治算法之后,我们再来说说什么是归并排序。归并排序是建立在归并操作上的一种有效的排序算法,该算法是采用分治法的一个非常典型的应用。
归并操作(merge),也叫归并算法,指的是将两个顺序序列合并成一个顺序序列的方法。
这样归并排序的原理就很容易理解了:首先,对于一个无序的长序列,可以把它分解为若干个有序的子序列,然后依次进行归并。如果我们说每一个数字都是单独有序的序列,那么只要把原始长序列依次分解,直到每个子序列都只有一个元素的时候,再依次把所有的序列进行归并,直到序列数为1,这样就完成了排序。
归并排序的速度仅次于快速排序,是稳定排序算法,归并排序的比较次数小于快速排序的比较次数,但移动次数一般多于快速排序的移动次数。
归并排序的实现由两种方法:
①、递归法
原理为:
#include
void Merge(int sourceArr[],int tempArr[], int startIndex, int midIndex, int endIndex)
{
int i = startIndex;
int j = midIndex+1;
int k = startIndex;
while(i!=midIndex+1 && j!=endIndex+1)//选出小的
{
if(sourceArr[i] > sourceArr[j]) //后者比前者小
{
tempArr[k++] = sourceArr[j++];
}
else //前者比后者小
{
tempArr[k++] = sourceArr[i++];
}
}
//----如果有剩下的,说明它比前面的都大,直接加入
while(i != midIndex+1)
{
tempArr[k++] = sourceArr[i++];
}
while(j != endIndex+1)
{
tempArr[k++] = sourceArr[j++];
}
//---------------------------------------------
for(i=startIndex; i<=endIndex; i++)//将排好顺序的再给sourceArr
sourceArr[i] = tempArr[i];
}
void MergeSort(int sourceArr[], int tempArr[], int startIndex, int endIndex)
{
int midIndex;
if(startIndex < endIndex)//判断是否分解为只有一个元素
{
midIndex = (startIndex + endIndex)/2;//将序列一分为二
MergeSort(sourceArr, tempArr, startIndex, midIndex);//分解左边
MergeSort(sourceArr, tempArr, midIndex+1, endIndex);//分解右边
Merge(sourceArr, tempArr, startIndex, midIndex, endIndex);//归并
}
}
int main(int argc, char * argv[])
{
int n,i,a[10],b[10];
scanf("%d",&n);
for(i=0;i
②、迭代法
原理为:
void Merge(int *a,int low,int mid,int high)
{
int i=low,j=mid+1,k=0;
int *temp = (int*)malloc((high-low+1)*sizeof(int));
while(i<=mid&&j<=high)
a[i]<=a[j]?(temp[k++]=a[i++]):(temp[k++]=a[j++]);
while(i<=mid)
temp[k++]=a[i++];
while(j<=high)
temp[k++]=a[j++];
memcpy(a+low,temp,(high-low+1)*sizeof(int));
free(temp);
}
void MergeSort(int *a,int n)
{
int length;
for(length=1;length
快速排序的基本思想是:通过一趟排序将要排序的数据分割成独立的两部分,其中一部分的所有数据都比另外一部分的所有数据都要小,然后再按此方法对这两部分数据分别进行快速排序,整个排序过程可以递归进行,以此达到整个数据变成有序序列。
快速排序也是一种分而治之思想在排序算法上的典型应用。本质上来看,快速排序应该算是在冒泡排序基础上的递归分治法。
对绝大多数顺序性较弱的随机数列而言,快速排序总是优于归并排序。
快速排序算法通过多次比较和交换来实现排序,其排序流程如下:
(1)首先设定一个分界值,通过该分界值将数组分成左右两部分。一般选第一个元素为“基准数” ,或者随机算一个
(2)将大于或等于分界值的数据集中到数组右边,小于分界值的数据集中到数组的左边。此时,左边部分中各元素都小于或等于分界值,而右边部分中各元素都大于或等于分界值。
(3)然后,左边和右边的数据可以独立排序。对于左侧的数组数据,又可以取一个分界值,将该部分数据分成左右两部分,同样在左边放置较小值,右边放置较大值。右侧的数组数据也可以做类似处理。
(4)重复上述过程,可以看出,这是一个递归定义。通过递归将左侧部分排好序后,再递归排好右侧部分的顺序。当左、右两个部分各数据排序完成后,整个数组的排序也就完成了
#include
int a[101],n;
void Quick_sort(int left,int right)
{
int i,j,t,temp;
if(left>right)
return;
temp=a[left]; //temp中存的就是基准数
i=left;
j=right;
while(i!=j)
{
while(a[j]>=temp && i
堆排序是指利用堆这种数据结构所设计的一种排序算法。堆是一个近似完全二叉树的结构,并同时满足堆的性质:即子结点的键值或索引总是小于(或者大于)它的父节点。既然堆顶元素永远都是整棵树中的最大值,那么我们将数据构建成堆后,只需要从堆顶取元素不就好了吗? 第一次取的元素,就是最大值。取完后把堆重新构建一下,然后再取堆顶的元素,取的就是第二大的值。 反复的取,取出来的数据也就是有序的数据。堆排序可以说是一种利用堆的概念来排序的选择排序。分为两种方法:
用这个动图和代码结合,要好好理解堆排序的具体实现过程。
#include
void swap(int *a,int *b)
{
int temp=*b;
*b=*a;
*a=temp;
}
void max_heapify(int arr[],int start,int end)
{
int dad=start;//建立父节点指标和子节点指标
int son=dad*2+1;
while(son<=end) //若子节点指标在范围内才做比较
{
if(son+1<=end&&arr[son]arr[son]) //如果父节点大于子节点代表调整完毕,直接跳出函数
return;
else //否则交换父子内容再继续子节点和孙节点比较
{
swap(&arr[dad],&arr[son]);
dad=son;
son=dad*2+1;
}
}
}
void heap_sort(int arr[],int len)
{
int i,j;
for(i=len/2-1;i>=0;i--)//初始化,i从最后一个父节点(len/2-1)开始调整
{
max_heapify(arr,i,len-1);
}
for(i=len-1;i>0;i--) //先将第一个元素和已排好元素前一位做交换,再重新调整,直到排序完毕
{
swap(&arr[0],&arr[i]);
max_heapify(arr,0,i-1);
}
}
int main()
{
int arr[] = {5,2,7,3,6,1,4};
int len=(int) sizeof(arr)/sizeof(*arr);
heap_sort(arr, len);
int i;
for(i=0;i
计数排序的核心在于将输入的数据值转化为键,存储在额外开辟的数组空间中。作为一种线性时间复杂度的排序,计数排序要求输入的数据必须是有确定范围的整数。它的优势在于在对一定范围内的整数排序时,它的复杂度为Ο(n+k)(其中k是整数的范围),快于任何比较排序算法。当然这是一种牺牲空间换取时间的做法,而且当O(k)>O(n*log(n))的时候其效率反而不如基于比较的排序(基于比较的排序的时间复杂度在理论上的下限是O(n*log(n)), 如归并排序,堆排序)。
算法步骤:
计数排序是有局限性的,如果要排序的数据范围非常大,也就是说,max-min的值非常大,计数排序就不太适用了。由此可见,计数排序只适用于正整数并且取值范围相差不大的数组排序使用,它的排序的速度是非常可观的。
#include
void Counting_sort(int a[],int b[],int len,int k)
{
if(a == NULL || k <= 0 || len <= 0)
return;
int count[k+1],i;
for(i = 0;i <= k;i++)//初始化辅助数组
count[i] = 0;
for(i = 0;i < len;i++)//统计值为a[i]的个数,count[i]是等于i的元素个数
count[a[i]] ++;
for(i = 1;i <= k;i++)//对所有的计数累加 ,这里的目的是为了后面的输出做准备,确定他们的位置
count[i]+=count[i-1];
for(i = len-1;i >= 0;i--)//输出到数组b中
{
int index = count[a[i]];//index是a[i]在数组b中的下标
b[index-1] = a[i];//b下标从0开始
count[a[i]] --; //如果有相同值元素的情况
}
}
int main()
{
int a[100];
int b[100]={0};
int n,i;
int max=-99999999;
int min=99999999;
scanf("%d",&n);
for(i=0;ia[i])
min=a[i];
}
int k=max-min+1;
Counting_sort(a,b,n,k);
for(i=0;i