排序算法(二)希尔排序算法

排序算法(二)希尔排序算法

1.基本概念
  希尔排序(Shell's-Sort)是插入排序的一种又称“缩小增量排序”(Diminishing Increment Sort),是直接插入排序算法的一种更高效的改进版本。希尔排序是非稳定排序算法。该方法因D.L.Shell于1959年提出而得名。

  希尔排序是把记录按下标的一定增量分组,对每组使用直接插入排序算法排序;随着增量逐渐减少,每组包含的关键词越来越多,当增量减至1时,整个文件恰被分成一组,算法便终止。


2.算法思路
  1.设数据的个数数量为n,取k=n/2,将下标差值为k的书分为一组,通过插入排序算法构成有序序列。
  2.再取k=k/2,将下标差值为k的数分为一组再通过插入排序算法构成有序序列。
  3.重复第二步,直到k=1时,执行简单插入排序。


3.举例
  假设有这样一组长度 16 的数 {13, 14, 94, 33, 82, 25, 59, 94, 65, 23, 45, 27, 73, 25, 39, 10},如果我们以 K=8 开始进行排序:

13 14 94 33 82 25 59 94 
65 23 45 27 73 25 39 10

  然后我们对每列进行排序:

13 14 45 27 73 25 39 10
65  23 94 33 82 25 59 94

  
将上述四行数字,依序接在一起时我们得到:{13, 14, 45, 27, 73, 25, 39, 10, 65, 23, 94, 33, 82, 25, 59, 94},然后再以 k=4 再次排序:

13 14 45 29
73 25 39 10
65 23 94 33
82 25 59 94

  然后我们对每列进行排序:

13 14 39 10
65 23 45 29
73 25 59 33
82 25 94 94

  一次类推 k=2、k=1,当k=1时则是执行简单插入排序。


4.动图示例

希尔排序


5.代码实现

       int[] numbers = {5, 97, 32, 54, 66, 77, 21, 33, 32, 25, 45, 89, 68, 67, 61, 12, 18, 19};
        int d = numbers.length; // 先求出数组长度
        while (d != 0) {
            d /= 2; // 将数组折半
            for (int i = 0; i < d; i++) { // 折半后相当于有 d=numbers.length/2 个竖列
                for (int j = i + d; j < numbers.length; j += d) { // 为每个竖列排序
                    // 接下来则是插入排序
                    int k = j - d;
                    int temp = numbers[j];
                    while (k >= 0 && temp > numbers[k]) {
                        // 注意这里每次交换的位置差值是 d
                        numbers[k + d] = numbers[k];
                        k -= d;
                    }
                    numbers[k + d] = temp;
                }

            }
        }


6.总结(参考百度百科)
不需要大量的辅助空间,和归并排序一样容易实现。希尔排序是基于插入排序的一种算法, 在此算法基础之上增加了一个新的特性,提高了效率。希尔排序的时间复杂度与增量序列的选取有关,例如希尔增量时间复杂度为O(n²),而Hibbard增量的希尔排序的时间复杂度为O(

),希尔排序时间复杂度的下界是n*log2n。希尔排序没有快速排序算法快 O(n(logn)),因此中等大小规模表现良好,对规模非常大的数据排序不是最优选择。但是比O(
)复杂度的算法快得多。并且希尔排序非常容易实现,算法代码短而简单。 此外,希尔算法在最坏的情况下和平均情况下执行效率相差不是很多,与此同时快速排序在最坏的情况下执行的效率会非常差。专家们提倡,几乎任何排序工作在开始时都可以用希尔排序,若在实际使用中证明它不够快,再改成快速排序这样更高级的排序算法. 本质上讲,希尔排序算法是直接插入排序算法的一种改进,减少了其复制的次数,速度要快很多。 原因是,当n值很大时数据项每一趟排序需要移动的个数很少,但数据项的距离很长。当n值减小时每一趟需要移动的数据增多,此时已经接近于它们排序后的最终位置。 正是这两种情况的结合才使希尔排序效率比插入排序高很多。Shell算法的性能与所选取的分组长度序列有很大关系。只对特定的待排序记录序列,可以准确地估算关键词的比较次数和对象移动次数。想要弄清关键词比较次数和记录移动次数与增量选择之间的关系,并给出完整的数学分析,今仍然是数学难题。

你可能感兴趣的:(排序算法(二)希尔排序算法)