首先将stl sort完整源码列如下所示:
template
inline void sort(_RandomAccessIter __first, _RandomAccessIter __last) {
__STL_REQUIRES(_RandomAccessIter, _Mutable_RandomAccessIterator);
__STL_REQUIRES(typename iterator_traits<_RandomAccessIter>::value_type,
_LessThanComparable);
if (__first != __last) {
__introsort_loop(__first, __last,
__VALUE_TYPE(__first),
__lg(__last - __first) * 2);
__final_insertion_sort(__first, __last);
}
}
其中
__introsort_loop
排序称为内省式排序,introsort是David R.Musser于1996年提出一种混合式排序算法:
Introspective Sorting
(内省式排序),简称
IntroSort
,其行为大部分与上面所说的
median-of-three Quick Sort
完全相同,但是当分割行为有恶化为二次方的倾向时,能够自我侦测,转而改用堆排序,使效率维持在堆排序的 O(nlgn),又比一开始就使用堆排序来得好。
__introsort_loop
排序第三个参数中所调用的函数__lg()
便是用来控制分割恶化情况,代码如下:
template
inline Size __lg(Size n) {
Size k;
for (k = 0; n > 1; n >>= 1) ++k;
return k;
}
即求
lg(n)
(取下整),意味着快速排序的递归调用最多 2*lg(n) 层。
内省式排序算法完整代码如下所示:
template
void __introsort_loop(_RandomAccessIter __first,
_RandomAccessIter __last, _Tp*,
_Size __depth_limit)
{
while (__last - __first > __stl_threshold) {
if (__depth_limit == 0) {
partial_sort(__first, __last, __last);
return;
}
--__depth_limit;
_RandomAccessIter __cut =
__unguarded_partition(__first, __last,
_Tp(__median(*__first,
*(__first + (__last - __first)/2),
*(__last - 1))));
__introsort_loop(__cut, __last, (_Tp*) 0, __depth_limit);
__last = __cut;
}
}
1.首先判断元素规模是否大于阀值__stl_threshold
,__stl_threshold
是一个常整形的全局变量,值为16,表示若元素规模小于等于16,则结束内省式排序算法,返回sort
函数,改用插入排序。
2.若元素规模大于__stl_threshold
,则限制。若已经到达最大限制层次的递归调用,则改用堆排序。代码中的partial_sort
即用堆排序实现。
3.若没有超过递归调用深度,则调用函数__unguarded_partition()
对当前元素做一趟快速排序,并返回枢轴位置。__unguarded_partition()
函数采用的便是上面所讲的使用两个迭代器的方法,代码如下:
template
_RandomAccessIter __unguarded_partition(_RandomAccessIter __first,
_RandomAccessIter __last,
_Tp __pivot)
{
while (true) {
while (*__first < __pivot)
++__first;
--__last;
while (__pivot < *__last)
--__last;
if (!(__first < __last))
return __first;
iter_swap(__first, __last);
++__first;
}
}
__stl_threshold
,然后返回sort
函数,对整个元素序列调用一次插入排序,此时序列中的元素已基本有序,所以插入排序也很快。至此,整个sort
函数运行结束。
备注;
1、STL
中的sort
并非只是普通的快速排序,除了对普通的快速排序进行优化,它还结合了插入排序和堆排序。根据不同的数量级别以及不同情况,能自动选用合适的排序方法。当数据量较大时采用快速排序,分段递归。一旦分段后的数据量小于某个阀值,为避免递归调用带来过大的额外负荷,便会改用插入排序。而如果递归层次过深,有出现最坏情况的倾向,还会改用堆排序。
2、快速排序最关键的地方在于枢轴的选择,最坏的情况发生在分割时产生了一个空的区间,这样就完全没有达到分割的效果。STL采用的做法称为median-of-three,即取整个序列的首、尾、中央三个地方的元素,以其中值作为枢轴。
分割的方法通常采用两个迭代器head
和tail
,head
从头端往尾端移动,tail
从尾端往头端移动,当head
遇到大于等于pivot
的元素就停下来,tail
遇到小于等于pivot
的元素也停下来,若head
迭代器仍然小于tail
迭代器,即两者没有交叉,则互换元素,然后继续进行相同的动作,向中间逼近,直到两个迭代器交叉,结束一次分割。