直接插入排序是一种最简单的插入排序。
插入排序:每一趟将一个待排序的记录,按照其关键字的大小插入到有序队列的合适位置里,直到全部插入完成。
这个过程类似摸牌:
先拿一张 5 在手里,
再摸到一张 4,比 5 小,插到 5 前面,
摸到一张 6,嗯,比 5 大,插到 5 后面,
摸到一张 8,比 6 大,插到 6 后面,
....
假设有一组无序序列 R0, R1, … , RN-1。
我们先将这个序列中下标为 0 的元素视为元素个数为 1 的有序序列。
然后,我们要依次把 R1, R2, … , RN-1 插入到这个有序序列中。所以,我们需要一个外部循环,从下标 1 扫描到 N-1 。
接下来描述插入过程。假设这是要将 Ri 插入到前面有序的序列中。由前面所述,我们可知,插入 Ri 时,前 i-1 个数肯定已经是有序了。
所以我们需要将 Ri 和 R0 ~ Ri-1 进行比较,确定要插入的合适位置。这就需要一个内部循环,我们一般是从后往前比较,即从下标 i-1 开始向 0 进行扫描。
实现:
public class insertSort {
public static void main(String[] args) {
int [] a = {3,6,4,2,10,11,5};
//有序队列[0,i-1] 待排序列[i,a.length-1]
for (int i=1;i=0&&a[j]>temp;j--){
a[j + 1] = a[j];
}
a[j+1] = temp;
}
for(int i=0;i
当数据正序时,执行效率最好,每次插入都不用移动前面的元素,时间复杂度为 O(N)。
当数据反序时,执行效率最差,每次插入都要前面的元素后移,时间复杂度为 O(N2)。
所以,数据越接近正序,直接插入排序的算法性能越好。
由直接插入排序算法可知,我们在排序过程中,需要一个临时变量存储要插入的值,所以空间复杂度为 1 。
直接插入排序的过程中,不需要改变相等数值元素的位置,所以它是稳定的算法。
希尔(Shell)排序又称为缩小增量排序,它是一种插入排序。它是直接插入排序算法的一种威力加强版。
希尔排序的基本思想是:
把记录按步长 gap 分组,对每组记录采用直接插入排序方法进行排序。
随着步长逐渐减小,所分成的组包含的记录越来越多,当步长的值减小到 1 时,整个数据合成为一组,构成一组有序记录,则完成排序。
实现:
public static void main(String[] args) {
int [] a = {3,6,4,2,10,11,5,10};
int gap = a.length/2;
//当步长的值减小到 1 时,循环终止
while(gap>=1){
// 把距离为 gap 的元素编为一个组,扫描所有组
for (int i=gap;i=0&&a[j]>temp;j-=gap){
a[j+gap] =a[j];
}
a[j+gap] =temp;
}
gap = gap / 2; // 减小增量
}
for(int i=0;i
步长的选择是希尔排序的重要部分。只要最终步长为 1 任何步长序列都可以工作。
算法最开始以一定的步长进行排序。然后会继续以一定步长进行排序,最终算法以步长为 1 进行排序。当步长为 1 时,算法变为插入排序,这就保证了数据一定会被排序。
Donald Shell 最初建议步长选择为 N/2 并且对步长取半直到步长达到 1。虽然这样取可以比 O(N2)类的算法(插入排序)更好,但这样仍然有减少平均时间和最差时间的余地。可能希尔排序最重要的地方在于当用较小步长排序后,以前用的较大步长仍然是有序的。
比如,如果一个数列以步长 5 进行了排序然后再以步长 3 进行排序,那么该数列不仅是以步长 3 有序,而且是以步长 5 有序。如果不是这样,那么算法在迭代过程中会打乱以前的顺序,那就不会以如此短的时间完成排序了。
已知的最好步长序列是由 Sedgewick 提出的(1, 5, 19, 41, 109,…),该序列的项来自这两个算式。
这项研究也表明“比较在希尔排序中是最主要的操作,而不是交换。”用这样步长序列的希尔排序比插入排序和堆排序都要快,甚至在小数组中比快速排序还快,但是在涉及大量数据时希尔排序还是比快速排序慢。
由上文的希尔排序算法演示图即可知,希尔排序中相等数据可能会交换位置,所以希尔排序是不稳定的算法。
直接插入排序是稳定的;而希尔排序是不稳定的。
直接插入排序更适合于原始记录基本有序的集合。
希尔排序的比较次数和移动次数都要比直接插入排序少,当 N 越大时,效果越明显。
在希尔排序中,增量序列 gap 的取法必须满足:**最后一个步长必须是 1 。**
直接插入排序也适用于链式存储结构;希尔排序不适用于链式结构。