快速排序以及常见排序算法性能对比

一、快速排序(交换排序)
1.1 简介
  快速排序(Quick Sort)由图灵奖获得者Tony Hoare发明,被列为20世纪十大算法之一。冒泡排序的升级版,交换排序的一种。快速排序的时间复杂度为O(nlog(n))。
  快速排序的基本思想是通过一趟排序将要排序的数据分割成独立的两部分,其中一部分的所有数据都比另外一部分的所有数据都要小,然后再按此方法对这两部分数据分别进行快速排序,整个排序过程可以递归进行,以此达到整个数据变成有序序列。
  快速排序的实例如下所示:
  (1)一趟排序的过程:

快速排序以及常见排序算法性能对比_第1张图片

  (2)排序的全过程

快速排序以及常见排序算法性能对比_第2张图片

1.2 python实现的代码

def quick_sort(lists, left, right):
    # 快速排序
    if left >= right:
        return lists
    key = lists[left]
    low = left
    high = right
    while left < right:
        while left < right and lists[right] >= key:
            right -= 1
        lists[left] = lists[right]
        while left < right and lists[left] <= key:
            left += 1
        lists[right] = lists[left]
    lists[right] = key
    quick_sort(lists, low, left - 1)
    quick_sort(lists, left + 1, high)
    return lists

1.3 总结
  (1)快速排序的时间性能取决于递归的深度。
  (2)当pivot_key恰好处于记录关键码的中间值时,大小两区的划分比较均衡,接近一个平衡二叉树,此时的时间复杂度为O(nlog(n))。
  (3)当原记录集合是一个正序或逆序的情况下,分区的结果就是一棵斜树,其深度为n-1,每一次执行大小分区,都要使用n-i次比较,其最终时间复杂度为O(n^2)。
  (4)在一般情况下,通过数学归纳法可证明,快速排序的时间复杂度为O(nlog(n))。
  (5)但是由于关键字的比较和交换是跳跃式的,因此,快速排序是一种不稳定排序。
  (6)同时由于采用的递归技术,该算法需要一定的辅助空间,其空间复杂度为O(logn)。
  (7)快速排序在数据较大时,其威力显现,但不够稳定,总体还是维持了nlog(n)的复杂度。
1.4 对快速排序算法的改进
(1)优化选取的pivot_key
  前面我们每次选取pivot_key的都是子序列的第一个元素,也就是lis[low],这就比较看运气。运气好时,该值处于整个序列的靠近中间值,则构造的树比较平衡,运气比较差,处于最大或最小位置附近则构造的树接近斜树。
  为了保证pivot_key选取的尽可能适中,采取选取序列左中右三个特殊位置的值中,处于中间值的那个数为pivot_key,通常会比直接用lis[low]要好一点。
(2)减少不必要的交换
  原来的代码中pivot_key这个记录总是再不断的交换中,其实这是没必要的,完全可以将它暂存在某个临时变量中。
(3) 优化小数组时的排序
  快速排序算法的递归操作在进行大量数据排序时,其开销能被接受,速度较快。但进行小数组排序时则不如直接插入排序来得快,也就是杀鸡用牛刀,未必就比菜刀来得快。
因此,一种很朴素的做法就是根据数据的多少,做个使用哪种算法的选择而已。
(4)优化递归操作
  可以采用尾递归的方式对整个算法的递归操作进行优化。

二、排序算法的总结
  排序常见的算法分类如下图所示:

快速排序以及常见排序算法性能对比_第3张图片

  每种算法的各种指标对比如下图所示:

快速排序以及常见排序算法性能对比_第4张图片

  其中图片中的名词解释如下:
  n: 数据规模;
  k:“桶”的个数;
  In-place: 内排序,占用常数内存,不占用额外内存;
  Out-place: 外排序,占用额外内存。

你可能感兴趣的:(快速排序以及常见排序算法性能对比)