完成了第一章的基础学习之后,终于迎来了第二章的排序相关算法的学习。本文主要是对章节 2.1 初级排序算法的整理总结,主要包括 选择排序、插入排序 以及 希尔排序。
值得注意的是,Sedgewick 教授还讲了两节排序的应用:洗牌和凸包算法,但是我掌握得不太好,就不再本文进行说明了,感兴趣的朋友建议移步视频自行学习总结。
注1:下面引用内容如无注明出处,均是书中摘录。
注2:所有 demo 演示均为视频 PPT demo 截图。
在正式讲解具体的排序算法前,先整理几个相关的概念知识,旁边后续深入。
首先根据 Comparable
接口提出了 全序关系 这一概念,主要有三个特性:
注:在教授的 PPT 里面提出的三个特性分别是:反对称性、传递性和总体性。
但是在官方网站以及书本中我找到的特性分别是:自反性、反对称性和传递性,这里以后者为准。
以时间作为一个常见的有序的对象实现了 Comparable
接口。
edu.princeton.cs.algs4.Date
edu.princeton.cs.algs4.Date#compareTo
基于前面的 Comparable
API,提出了一个排序算法模板,主要包含了 比较对象 的方法 less()
和 交换对象 的方法 exch()
,这两个方法用于操作数据。
方法如下(来自官网):
private static boolean less(Comparable v, Comparable w) {
return (v.compareTo(w) < 0);
}
private static void exch(Comparable[] a, int i, int j) {
Comparable swap = a[i];
a[i] = a[j];
a[j] = swap;
}
光看字有点难一下子看明白,来结合教授的 PPT 理解。
实际上最核心的步骤已经展示出来了,即:需要找到后侧未排序的集合中的最小值进行交换。
edu.princeton.cs.algs4.Selection#sort
总结一下选择排序两个特点:
上面的选择排序只和最小的(包括自己)进行交换 —— 对右侧操作,而插入排序则是和已经排序好的部分进行交换 —— 对左侧操作。
edu.princeton.cs.algs4.Insertion#sort
对于插入排序,不同情况下的数组排序情况有所不同。
最好的情况是:
需要 N-1 次比较和 0 次交换
有序数组,只需要证明后一个值比前一个值大,不需要进行交换。
最坏的情况是:
需要~N2/2 次比较和~N2/2 次交换
逆序数组,且不存在重复值,每个元素都需要移动到数组开头的位置。
希尔排序是基于插入排序的一种快速排序算法。
希尔排序的思想是使数组中任意间隔为h的元素都是有序的。这样的数组被称为h有序数组。换句话说,一个h有序数组就是h个互相独立的有序数组编织在一起组成的一个数组。
……
实现希尔排序的一种方法是对于每个h,用插入排序将h个子数组独立地排序。
希尔排序的关键在于增量序列的选择。
透彻理解希尔排序的性能至今仍然是一项挑战。实际上,算法2.3是我们唯一无法准确描述其对于乱序的数组的性能特征的排序方法。
教授在 PPT 中列举了几项常见的增量序列:
对于上面的几种增量序列,教授进行了简单的说明:
当然,维基百科 上有更加详细的增量序列表:
edu.princeton.cs.algs4.Shell#sort
实际上,Knuth 增量序列的增量为 1/2(3k-1),不过在代码中使用了 while 循环来找出最大增量(大于 N/3,N为总长度),然后再通过 h /= 3
来缩短增量。
来做一下计算,证明:
3 k − 1 2 ∗ 3 + 1 = 3 k + 1 − 1 2 \frac{3^k-1}{2}*3+1=\frac{3^{k+1}-1}{2} 23k−1∗3+1=23k+1−1
从左边开始展开计算:
3 k − 1 2 ∗ 3 + 1 \frac{3^k-1}{2}*3+1 23k−1∗3+1
拆解合并常数项得:
3 2 ∗ 3 k − 3 2 + 1 = 3 2 ∗ 3 k − 1 2 \frac{3}{2}*3^k-\frac{3}{2}+1 = \frac{3}{2}*3^k-\frac{1}{2} 23∗3k−23+1=23∗3k−21
利用指数的乘法规则:
3 ∗ 3 k = 3 k + 1 3*3^k=3^{k+1} 3∗3k=3k+1
最终化简得:
3 k + 1 − 1 2 \frac{3^{k+1} - 1}{2} 23k+1−1
(完)