源码共读行动每周一算法之——快速排序算法

快速排序是由东尼·霍尔所发展的一种排序算法。在平均状况下,排序 n 个项目要Ο(n log n)次比较。在最坏状况下则需要Ο(n2)次比较,但这种状况并不常见。事实上,快速排序通常明显比其他Ο(n log n) 算法更快,因为它的内部循环(inner loop)可以在大部分的架构上很有效率地被实现出来。

快速排序使用分治法(Divide and conquer)策略来把一个串行(list)分为两个子串行(sub-lists)。


算法步骤:

  1. 从数列中挑出一个元素,称为 “基准”(pivot)。

  2. 重新排序数列,所有元素比基准值小的摆放在基准前面,所有元素比基准值大的摆在基准的后面(相同的数可以到任一边)。在这个分区退出之后,该基准就处于数列的中间位置。这个称为分区(partition)操作。
    结果如下:
    | 比基准小的数 | 基准 | 比基准大的数 |
    return : 基准的位置 mid

  3. 递归地(recursive)把小于基准值元素的子数列和大于基准值元素的子数列排序。

递归的最底部情形,是数列的大小是零或一,也就是永远都已经被排序好了。虽然一直递归下去,但是这个算法总会退出,因为在每次的迭代(iteration)中,它至少会把一个元素摆到它最后的位置去。

首先简单描述一下快速排序的基本思路

快速排序是基于分治模式处理的,对一个典型子数组A[p…r]排序的分治过程为三个步骤:

  1. 分解:
    A[p..r]被划分为俩个(可能空)的子数组A[p ..q-1]和A[q+1 ..r],
    使得:
    A[p ..q-1] <= A[q] <= A[q+1 ..r]
  2. 解决:通过递归调用快速排序,对子数组A[p ..q-1]和A[q+1 ..r]排序。

  3. 合并。

快速排序伪代码(来自算法导论)

 QUICK_SORT(A,p,r)
    if(p1)
             QUICK_SORT(A,q+1,r)

//核心函数,对数组A[p,r]进行就地重排,将小于A[r]的数移到数组前半部分,将大于A[r]的数移到数组后半部分。
PARTITION(A,p,r)
    pivot <—— A[r]
    i <—— p-1
    for j <—— p to r-1
        do if A[j] < pivot
            i <—— i+1
            exchange A[i]<——>A[j]
    exchange A[i+1]<——>A[r]
return i+1

示例:对以下数组,进行快速排序,下图示出了patition过程。

2 8 7 1 3 5 6 4(主元)

一个快速排序的实现代码如下


#include 
int partition(int *arr,int low,int high)
{
    int pivot=arr[high];
    int i=low-1;
    int j,tmp;
    for(j=low;jif(arr[j]1];
    arr[i+1]=arr[high];
    arr[high]=tmp;
    return i+1;
}
void quick_sort(int *arr,int low,int high)
{
    if(lowint mid=partition(arr,low,high);
        quick_sort(arr,low,mid-1);
        quick_sort(arr,mid+1,high);
    }
}
//test
int main()
{
    int arr[10]={1,4,6,2,5,8,7,6,9,12};
    quick_sort(arr,0,9);
    int i;
    for(i=0;i<10;++i)
        printf("%d ",arr[i]);
}

算法复杂度


最坏情况发生在划分过程产生的俩个区域分别包含n-1个元素和一个0元素的时候,
即假设算法每一次递归调用过程中都出现了,这种划分不对称。那么划分的代价为O(n),
因为对一个大小为0的数组递归调用后,返回T(0)=O(1)。
估算法的运行时间可以递归的表示为:

T(n)=T(n-1)+T(0)+O(n)=T(n-1)+O(n).

可以证明为T(n)=O(n^2)。
因此,如果在算法的每一层递归上,划分都是最大程度不对称的,那么算法的运行时间就是O(n^2)。

最快情况下快排时间复杂度:
最快情况下,即PARTITION可能做的最平衡的划分中,得到的每个子问题都不能大于n/2.
因为其中一个子问题的大小为|n/2|。另一个子问题的大小为|-n/2-|-1.
在这种情况下,快速排序的速度要快得多:

T(n)<=2T(n/2)+O(n).可以证得,T(n)=O(nlgn)。

来自:

here!

你可能感兴趣的:(源码共读系列,排序算法,快速排序)