《算法(第四版)》排序-----高速排序

參考文章:   http://ahalei.blog.51cto.com/4767671/1365285


1.概念

高速排序,听这个名字就能想到它排序速度快。它是一种原地排序(仅仅须要一个非常小的辅助栈,注意不是数组)。且将长度为N的数组排序所需的时间和NlgN成正比

缺点是:非常脆弱。在实现时一定要注意几个小细节(以下详细讲),才干避免错误。


2.基本思想:

随机找出一个数(通常就拿数组第一个数据即可)。把它插入一个位置。使得它左边的数都比它小。它右边的数据都比它大,这样就将一个数组分成了两个子数组,然后再依照相同的方法把子数组再分成更小的子数组,直到不能分解为止。    它也是分治思想的一个经典实验(归并排序也是)


3.高速与归并排序的差别:

(1)归并排序将数组分成两个子数组,然后分别排序。并将有序的子数组归并以将整个数组排序;

         高速排序将数组排序的方式是当两个子数组都有序时整个数组也就自然有序了

(2)归并排序的递归调用发生在处理整个数组之前

        高速排序的递归调用发生在处理整个数组之后


4.举例说明
假设我们如今对“6  1  2 7  9  3  4  5 10  8”这个10个数进行排序。首先在这个序列中随便找一个数作为基准数(不要被这个名词吓到了,就是一个用来參照的数。待会你就知道它用来做啥的了)。为了方便。就让第一个数6作为基准数吧。接下来,须要将这个序列中所有比基准数大的数放在6的右边,比基准数小的数放在6的左边,相似以下这样的排列。
      3  1  2 5  4  6  9 7  10  8

       在初始状态下。数字6在序列的第1位。我们的目标是将6挪到序列中间的某个位置,假设这个位置是k。如今就须要寻找这个k,而且以第k位为分界点,左边的数都小于等于6,右边的数都大于等于6。

想一想,你有办法能够做到这点吗?


       给你一个提示吧。请回顾一下冒泡排序,是怎样通过“交换”,一步步让每一个数归位的。此时你也能够通过“交换”的方法来达到目的。详细是怎样一步步交换呢?怎样交换才既方便又节省时间呢?先别急着往下看,拿出笔来,在纸上画画看。

我高中时第一次学习冒泡排序算法的时候,就认为冒泡排序非常浪费时间,每次都仅仅能对相邻的两个数进行比較,这显然太不合理了。于是我就想了一个办法。后来才知道原来这就是“高速排序”。请同意我小小的自恋一下(^o^)。


方法事实上非常easy:分别从初始序列“6  1  2 7  9  3  4  5 10  8”两端開始“探測”。先从找一个小于6的数。再从找一个大于6的数。然后交换他们。

这里能够用两个变量ij,分别指向序列最左边和最右边。我们为这两个变量起个好听的名字“哨兵i”和“哨兵j”。

刚開始的时候让哨兵i指向序列的最左边(即i=1),指向数字6。让哨兵j指向序列的最右边(即j=10)。指向数字8


      首先哨兵j開始出动。由于此处设置的基准数是最左边的数,所以须要让哨兵j先出动。这一点非常重要(请自己想一想为什么)。哨兵j一步一步地向左挪动(即j--)。直到找到一个小于6的数停下来。

接下来哨兵i再一步一步向右挪动(即i++)。直到找到一个数大于6的数停下来。最后哨兵j停在了数字5面前。哨兵i停在了数字7面前。





      如今交换哨兵i和哨兵j所指向的元素的值。交换之后的序列例如以下。

       6  1  2  5  9 3  4  7  10  8



       到此,第一次交换结束。

接下来開始哨兵j继续向左挪动(再友情提醒,每次必须是哨兵j先出发)。

他发现了4(比基准数6要小,满足要求)之后停了下来。哨兵i也继续向右挪动的,他发现了9(比基准数6要大,满足要求)之后停了下来。

此时再次进行交换,交换之后的序列例如以下。

       6  1  2 5  4  3  9  7 10  8

       第二次交换结束。“探測”继续。

哨兵j继续向左挪动。他发现了3(比基准数6要小,满足要求)之后又停了下来。哨兵i继续向右移动,糟啦。此时哨兵i和哨兵j相遇了,哨兵i和哨兵j都走到3面前。

说明此时“探測”结束。我们将基准数6和3进行交换。交换之后的序列例如以下。

3  1 2  5  4  6  9 7  10  8

       到此第一轮“探測”真正结束。

此时以基准数6为分界点,6左边的数都小于等于6。6右边的数都大于等于6。回顾一下刚才的过程。事实上哨兵j的使命就是要找小于基准数的数。而哨兵i的使命就是要找大于基准数的数,直到i和j碰头为止。


       OK,解释完成。

如今基准数6已经归位,它正优点在序列的第6位。此时我们已经将原来的序列,以6为分界点拆分成了两个序列,左边的序列是“3  1 2  5  4”,右边的序列是“9  7  10  8”。

接下来还须要分别处理这两个序列。由于6左边和右边的序列眼下都还是非常混乱的。只是不要紧,我们已经掌握了方法。接下来仅仅要模拟刚才的方法分别处理6左边和右边的序列即可。如今先来处理6左边的序列现吧。


       左边的序列是“3  1  2 5  4”。请将这个序列以3为基准数进行调整,使得3左边的数都小于等于3,3右边的数都大于等于3。

好了開始动笔吧。


       假设你模拟的没有错。调整完成之后的序列的顺序应该是。

       2  1  3  5  4

       OK,如今3已经归位。

接下来须要处理3左边的序列“2 1”和右边的序列“5 4”。对序列“2 1”以2为基准数进行调整,处理完成之后的序列为“1 2”,到此2已经归位。序列“1”仅仅有一个数,也不须要进行不论什么处理。至此我们对序列“2 1”已所有处理完成,得到序列是“1 2”。序列“5 4”的处理也仿照此方法。最后得到的序列例如以下。

       1  2  3 4  5  6 9  7  10  8

       对于序列“9  7  10  8”也模拟刚才的过程,直到不可拆分出新的子序列为止。终于将会得到这样的序列,例如以下。

       1  2  3 4  5  6  7  8 9  10

       到此。排序全然结束。细心的同学可能已经发现,高速排序的每一轮处理事实上就是将这一轮的基准数归位,直到所有的数都归位为止。排序就结束了。

以下上个霸气的图来描写叙述下整个算法的处理过程。



       高速排序之所比較快,由于相比冒泡排序,每次交换是跳跃式的。每次排序的时候设置一个基准点,将小于等于基准点的数所有放到基准点的左边,将大于等于基准点的数所有放到基准点的右边。这样在每次交换的时候就不会像冒泡排序一样每次仅仅能在相邻的数之间进行交换,交换的距离就大的多了。

因此总的比較和交换次数就少了。速度自然就提高了。当然在最坏的情况下,仍可能是相邻的两个数进行了交换。

因此高速排序的最差时间复杂度和冒泡排序是一样的都是O(N2)。它的平均时间复杂度为O(NlogN)。事实上高速排序是基于一种叫做“二分”的思想。


5.详细实现例如以下:

public class QuickSort{
    public static void quickSort(Comparable[] a){
        //StdRandom.shuffle(a);//将数组a顺序打乱。消除对输入的依赖。这是《算法第四版》作者写好的静态函数。
        quickSort(a, 0, a.length-1);
    }
    public static void quickSort(Comparable[] a, int lo, int hi){
        if(hi <= lo)    //跳出递归的条件。相当于不能再分解了
            return;
        int j = partition(a, lo, hi);    //切分(将a[lo]插入到数组中合适的位置:左边比他小,右边比它大,这样就将数组切分成两部分)
        quickSort(a, lo, j-1);           //将左半部分a[lo...j-1]排序
        quickSort(a, j+1, hi);           //将右半部分a[j+1...hi]排序
    }
    private static int partition(Comparable[] a, int lo, int hi){
    //将数组切分为a[lo...i-1]、a[i] 和a[i+1...hi];
        int i = lo, j = hi + 1;   //左右扫描的指针,j=hi+1,非常大的程度上是为了以下写--j,
        Comparable v = a[lo];     //把要用来切分的元素保留
        while(true){              // 扫描左右检查扫描是否结束并交换元素
            while(less(a[++i], v))//两种条件会跳出while循环。直到在左側找到比v大的。或i指针已经走到头了(i==hi),++i的原因:v是从lo開始的,满足less()
                if(i == hi)   break;//只是这两个推断越界的測试条件是多余的。能够去掉。由于本身i,j就是从两端走过去的。不等走到头就
            while(less(v,a[--j]));
                if(j == lo)   break;
            if(i >= j)    break;  //i和j碰上了,那就跳出整个循环。
            exch(a,i,j);          //假设上两个while都跳出,说明i。j停在了a[i]>v ,a[j]


6.注意:

(1)处理切分元素值有反复的情况,所以左側扫描最好是遇到 >= 切分元素值的元素时停下。右側扫描遇到 <= 切分元素值的元素时停下,这样能比秒算法执行时间平方级别

(2)终止递归:一定保证终止递归的条件,否则就递归陷入死循环了

7.算法改进

7.1 切换到插入排序

和大多数递归排序算法一样。改进高速排序性能的一个简单办法是基于以下两点:

(1)对于小数组,高速排序比插入排序慢

(2)由于递归,高速排序的sort()方法在小数组中也会调用自己

因此,在排序小数组应该切换到插入排序。简单的修改算法中的一句就可:将sort()中的语句

                                      if(hi <= lo)   return;

改成:                        if(hi <= lo + M){Insertion.sort(a, lo, hi);   return; }

这样就能够在小数组时转换成插入排序

转换參数M的最佳值是和系统相关的,可是5~15 之间的惹你值在大多数情况下都能令人惬意


7.2 三取样切分

改进高速排序性能的第二个办法就是使用子数组的一小部分元素的中位数来切分数组,这样做得到的切分效果更好,可是代价是要计算中位数。

人们发现将取样大小设为3并用大小居中的元素气氛效果最好,我们还能够将取样元素放在数组末尾作为“哨兵”来去掉partition()中的数组边界測试。



7.3 熵最有的排序

实际应用中常常会出现含有大量反复元素的数组,比如我们可能须要将大量人员资料依照生日排序,或是依照性别区分开来,在这样的情况下。我们事先的高速排序还有非常大的改进空间。

简单的想法是将数组分为三部分,分别相应小于。等于和大于切分元素的数组元素,这也是荷兰国旗引发的易到景点编程练习,由于这就好像用三种可能的主键值将数组排序一样,这三种主键值相应这荷兰国旗上的三种颜色。

三向切分的高速排序算法思想例如以下:

它从左到右遍历数组一次。维护一个指针lt使a[lo...lt-1]中的元素都小于v,一个指针gt使得a[gt+1...hi]中的元素都大于v,一个指针i使得a[lt...i-1]中的元素都等于v,a[i...gt]中的元素都还未确定。

(1)a[i]  <  v     将a[lt]和a[i]交换,将lt和i加一

(2)a[i]  >  v     将a[gt]和a[i]交换,将gt减一

(3)a[i]  =  v     将i加一

lt++的原因:lt相当于v的当前位置,a[lt] =v。所以仅仅有当a[lt] >a[i]时才会交换,交换后v之前就多了一个值,所以lt++

i++的原因:有两种情况i++,第一种a[i] < v,这样必定会将a[i] 这个值换到v之前,然而一直在动的那个指针就是i,所以i要向前走。比較下一个a[i] 与v的大小。假设相等自己主动加一

gt--的原因:交换a[gt]和a[i]的原因是,a[i]>v了。那么肯定a[i]的值满足了在v后面,索性把这个大于v的就放最后面,肯定满足v后面的都比它大,所以把a[gt]拿过来,此时还不能                          保 证a[gt]的大小,所以放到i这个位置上,在下一轮比較a[i].compareTo(v),就能确定拿过来的a[gt]究竟比v大还是小了,可是已经确定由a[i]和a[gt]交换后的a[gt]肯                          定比 v  大,所以没有必要下一轮交换时再交换到前面去,所以gt减一


详细实现代码例如以下

public  class Quick3Way{
    private static void sort(Comparable[] a, int lo, int hi){
        if(hi <= lo)    return ;
        int lt = lo, i = lo+1, gt = hi;
        Comparable v = a[lo];
        while (i <= gt){
            int cmp = a[i].compareTo(v);
            if  (cmp < 0){   exch(a, lt++, i++);
            }else if(cmp > 0){  exch(a, i, gt--);
            }else{
                i++;
            }
        }//  如今a[lo...lt-1] < v = a[lt...gt] < a[gt+1...hi]成立
        sort(a, lo, lt-1);
        sort(a, gt+1, hi);
    }
}

图示交换过程:

《算法(第四版)》排序-----高速排序_第1张图片《算法(第四版)》排序-----高速排序_第2张图片


所以能够看出,当数组中的元素存在大量的反复数据的时候,三向切分的高速排序效果更好




你可能感兴趣的:(《算法(第四版)》排序-----高速排序)