排序算法 - 稳定与不稳定

稳定排序与不稳定排序

  • 关于十大经典排序算法
  • 什么是稳定/不稳定性质
  • 稳定的好处
  • 稳定的排序算法
        • ——冒泡排序、插入排序、归并排序、基数排序
      • 1. 冒泡排序
      • 2. 插入排序
      • 3. 归并排序
      • 4. 基数排序
  • 不稳定的排序算法
        • ——选择排序、快速排序、希尔排序、堆排序
      • 1. 选择排序
      • 2. 快速排序
      • 3. 希尔排序
      • 4. 堆排序

关于十大经典排序算法

avatar
avatar

什么是稳定/不稳定性质

       通俗地讲,就是能保证排序前两个相等的数在序列的前后位置顺序和排序后两者的前后位置顺序相同。形式化一下,如果Ai = Aj,Ai原来在前,排序后Ai还在Aj前面。

稳定的好处

       排序算法如果稳定,那么从一个key上排序,然后再从另一个key上排序,前面排序的结果可以为之后的排序所用。基数排序就是这样,先按低位排序,逐次按高位排序,低位相同的元素其顺序再高位也相同时是不会改变的。

稳定的排序算法

——冒泡排序、插入排序、归并排序、基数排序

1. 冒泡排序

       O(n2)
       冒泡排序,把小的元素往前调或者把大的元素往后调。比较和交换都发生在相邻两个元素间。
       所以,如果两个元素相等且相邻,则不需要交换。如果两个相等的元素不相邻,那么即使通过前面的两两交换使这两个元素相邻,这时也不会交换。
       所以相同元素的前后顺序并没有改变,所以冒泡排序是一种稳定排序算法。

2. 插入排序

       O(n2
       插入排序是在一个已经有序的小序列的基础上,一次插入一个元素。开始时,这个有序的小序列只有1个元素,就是第一个元素。
       比较是从有序序列的末尾开始,即,想要插入的元素和已有序的最大元素开始比起,如果比它大则直接插入在后面,否则一直往前找直到找到它该插入的位置。如果碰见一个和插入元素相等的,那么插入元素把想插入的元素放在相等元素的后面。
       所以,相等元素的前后顺序没有改变,从原无序序列出去的顺序就是排好序后的顺序,所以插入排序是稳定的。

3. 归并排序

       O(n log2n)
       归并排序是把序列递归地分成短序列,递归出口是短序列只有1个元素(认为直接有序)或者2个序列(1次比较和交换),然后把各个有序的段序列合并成一个有序的长序列,不断合并直到原序列全部排好序。
       可以发现,在短序列只有1个或2个元素时,1个元素不会交换,2个元素如果大小相等也不会多此一举进行交换,因此不会破坏稳定性。
       那么,在短的有序序列合并的过程中,稳定是是否受到破坏?没有,合并过程中我们可以保证如果两个当前元素相等时,我们把处在前面的序列的元素保存在结果序列的前面,这样就保证了稳定性。
       所以,归并排序也是稳定的排序算法。

4. 基数排序

       O(d(r+n))
       基数排序是按照低位先排序,然后收集;再按照高位排序,然后再收集;依次类推,直到最高位。有时候有些属性是有优先级顺序的,先按低优先级排序,再按高优先级排序,最后的次序就是高优先级高的在前,高优先级相同的低优先级高的在前。基数排序基于分别排序,分别收集,所以其是稳定的排序算法。

不稳定的排序算法

——选择排序、快速排序、希尔排序、堆排序

1. 选择排序

       O(n2)
       选择排序是给每个位置选择当前元素最小的,比如给第一个位置选择最小的,在剩余元素里面给第二个元素选择第二小的,依次类推,直到第n - 1个元素,第n个元素不用选择了,因为只剩下它一个最大的元素了。
       那么,在一趟选择中,如果当前元素比一个元素小,而该小的元素又出现在一个和当前元素相等的元素后面,那么交换后稳定性就被破坏了。
       举个例子,序列5 8 5 2 9,我们知道第一遍选择第1个元素5会和2交换,那么原序列中2个5的相对前后顺序就被破坏了,所以选择排序不是一个稳定的排序算法。

2. 快速排序

       O(n log2n)
       快速排序有两个方向,左边的i下标一直往右走,当a[i] <= a[center_index](center_index是中枢元素的数组下标,一般取为数组第0个元素),而右边的j下标一直往左走,当a[j] > a[center_index]。如果i和j都走不动了,i <= j,交换a[i]和a[j],重复上面的过程,直到i > j。交换a[j]和a[center_index],完成一趟快速排序。递归进行。
       在中枢元素和a[j]交换的时候,很有可能把前面的元素的稳定性打乱,比如序列为5 3 3 4 3 8 9 10 11,现在中枢元素5和3(第5个元素,下标从1开始计)交换就会把元素3的稳定性打乱,所以快速排序是一个不稳定的排序算法,不稳定性发生在中枢元素和a[j] 交换的时刻。

3. 希尔排序

       O(n log2n)
       希尔排序是按照不同步长对元素进行插入排序。当刚开始元素很无序的时候,步长最大,所以插入排序的元素个数很少,速度很快;当元素基本有序了,步长很小,插入排序对于有序的序列效率很高。所以,希尔排序的时间复杂度会比O(n^2)好一些。
       由于多次插入排序,我们知道一次插入排序是稳定的,不会改变相同元素的相对顺序。但在不同的插入排序过程中,相同的元素可能在各自的插入排序中移动,最后其稳定性就会被打乱,所以shell排序是不稳定的。

4. 堆排序

       O(n log2n)
       堆排序通过维护一个大根堆/小根堆来排序。堆的结构:节点i的孩子为2i 和 2i + 1节点。
       大顶堆要求父节点大于等于其2个子节点,小顶堆要求父节点小于等于其2个子节点。
       在一个长为n 的序列,堆排序的过程是从第 n 2 \frac{n}{2} 2n开始和其子节点共3个值选择最大(大顶堆)或者最小(小顶堆),这3个元素之间的选择当然不会破坏稳定性。但当为 n 2 \frac{n}{2} 2n - 1, n 2 \frac{n}{2} 2n - 2, … 1这些个父节点选择元素时,就会破坏稳定性。有可能第 n 2 \frac{n}{2} 2n个父节点交换把后面一个元素交换过去了,而第 n 2 \frac{n}{2} 2n - 1个父节点对于后面一个相同的元素没有交换,那么这2个相同的元素之间的稳定性就被破坏了。
       所以,堆排序不是稳定的排序算法。

你可能感兴趣的:(数据结构与算法,算法,排序算法)