排序与搜索——快速排序

快速排序

快速排序(英语:Quicksort),又称划分交换排序(partition-exchange sort),通过一趟排序将要排序的数据分割成独立的两部分,其中一部分的所有数据都比另外一部分的所有数据都要小,然后再按此方法对这两部分数据分别进行快速排序,整个排序过程可以递归进行,以此达到整个数据变成有序序列。

步骤为:

  • 从数列中挑出一个元素,称为"基准"(pivot),重新排序数列,所有元素比基准值小的摆放在基准前面,所有元素比基准值大的摆在基准的后面(相同的数可以到任一边)。在这个分区结束之后,该基准就处于数列的中间位置。这个称为分区(partition)操作。
  • 递归地(recursive)把小于基准值元素的子数列和大于基准值元素的子数列排序。
  • 递归的最底部情形,是数列的大小是零或一,也就是永远都已经被排序好了。虽然一直递归下去,但是这个算法总会结束,因为在每次的迭代(iteration)中,它至少会把一个元素摆到它最后的位置去。

快速排序的分析

如图所示,这是一个无序的列表,如何实现快速排序呢?

首先我们需要设计两个游标,一个游标向前移动,一个游标向后移动,目标是找出54的位置,54这个值我们定位mid_value中间值。low游标是从0开始的,high的游标是从最后开始,先让右边的游标开始移动即high先移动,我们发现20比54小。

这是54已经被mid_value保存了,将20移到54的原位置,即low所指的位置,如上图所示,代码实现实现如下图。
这个时候是不是high所指的位置空了啊,那么我们就应该移动low游标找出一个比mid_value大的,放入high所指的位置,即20的原位置。
low游标移动至26的位置,发现26比mid_value小,不符合后移的要求,这时该怎么做呢?
当low的游标指向93时,发现可以满足我们的要求

这时我们就需要将low所指的93移到high所指的空位置上,然后将high的像左移动,遇到的第一个元素是55比mid_value大,这时我们的代码就要考虑让high接着左移
当high指向44的时候发现44比54小,那么将high所指向的44移至low所指的空位置上
然后low移动到17发现17比54小,无需变动,移至77后,发现77比54大,将77的位置移至high所指向的空位置上,然后移动high发现31比54小,将31放到low的空位置上,即77原位置
然后low+=1正好与high重合,一旦重合这个重合的位置就是54,即mid_value。
这时我么会发现54左边的元素都比54小,反之右边都比54大

代码实现的思路

这段代码我觉得不难理解吧,第一个while循环是high游标向左移动,while循环的条件是lowmid_value,因为一旦high游标指向的数值小于mid_value就要交换位置了。
一旦交换位置立马就轮到移动low的游标了,思路同high游标一样,high完成位置交换后,又轮到high了,开始轮回。
while实现多次轮回,>=是考虑到数值重合的问题

没包含等于情况的时候
左边的54会移到右边,右边的54会移到左边
为了实现54都在一边的情况,让alist[high]>=mid_value,就是让high游标指向的54不移动而是直接跳过,让左边的low游标指向54的时候再互换位置。
我们接着看代码,当low和high重合的时,如下图,55是刚从low那边移动过来,这是要开始移动high了,也就是重新开始新一轮轮回,high-=1,是不是直接就与high重合了,然后,low+=1是不是就low的游标前移了,high-=1,high的游标左移了,就不再满足大while的条件了,也无法控制mid_value。
这时就需要进行改进了:
将游标的加减纳入循环之中,避免了越界现象,重合后 只进行互换游标不再左右移动
插入重合后的mid_value数值

此时,我们找到了中间值,并以中间值作为界限,划分成了两个子列,两个子列还要重复上述操作,进行快速排序。
分割到只有一个元素的时候就实现了
这时就用到了递归

这是课件上的快速排序图示

完整代码实现:

def quick_sort(li,start,end):
    if start >= end:
        return
    low = start
    high = end
    mid_value = li[start]
    while low < high:
        #先从移动high游标开始
        while li[high] >= mid_value and low < high:
            high -= 1
        li[low] = li[high]

        #开始移动low游标
        while li[low] < mid_value and low < high:
            low += 1
        li[high] = li[low]
    #这个时候游标low和high均指向mid_value
    li[low] = mid_value

    quick_sort(li,start,low-1)
    quick_sort(li,low+1,end)

if __name__ == '__main__':
    ali = [12,23,11,33,4,55,12,44,52,21]
    print(ali)
    quick_sort(ali,0,len(ali)-1)
    print(ali)

时间复杂度

最优时间复杂度:O(nlogn)
最坏时间复杂度:O(n^2)
稳定性:不稳定

从一开始快速排序平均需要花费O(n log n)时间的描述并不明显。但是不难观察到的是分区运算,数组的元素都会在每次循环中走访过一次,使用O(n)的时间。在使用结合(concatenation)的版本中,这项运算也是O(n)。
在最好的情况,每次我们运行一次分区,我们会把一个数列分为两个几近相等的片段。这个意思就是每次递归调用处理一半大小的数列。因此,在到达大小为一的数列前,我们只要作log n次嵌套的调用。这个意思就是调用树的深度是O(log n)。但是在同一层次结构的两个程序调用中,不会处理到原来数列的相同部分;因此,程序调用的每一层次结构总共全部仅需要O(n)的时间(每个调用有某些共同的额外耗费,但是因为在每一层次结构仅仅只有O(n)个调用,这些被归纳在O(n)系数中)。结果是这个算法仅需使用O(n log n)时间。如果每次找到的中间都是开头第一个那就是最坏的时间复杂度了。

你可能感兴趣的:(排序与搜索——快速排序)