堆排序(Heap Sort):使用堆这种数据结构来实现排序。
先看下堆的定义:
最小堆(Min-Heap)是关键码序列{k0,k1,…,kn-1},它具有如下特性:
ki<=k2i+1,
ki<=k2i+2(i=0,1,…)
简单讲:孩子的关键码值大于双亲的。
ki>=k2i+1,
ki>=k2i+2(i=0,1,…)
同样的:对于最大堆,双亲的关键码值大于两个孩子的(如果有孩子)。
堆的特点:
要想实现排序,第一个问题:如何建堆?(以最小堆为例,最大堆同理)
建堆:从最后一个内部节点开始,不断地向下调整,直到根节点。
画个流程图,看得更明白:矩形框表示要调整的位置
仔细看上面的流程图,相信你一定可以清楚明白整个调整过程。
建堆代码:我们使用顺序结构存储堆(可不要以为树形结构一定得使用链表来实现),向下调整(heapSiftDown())的方法是关键,建堆的代码如下:
void heapSiftDown(int a[], int n, int pos) //从pos位置向下调整 { int i = pos; int j = 2 * i + 1; //j为i的左孩子 while (j < n) { if (j + 1 < n && a[j + 1]<a[j]) //如果右孩子存在,并且右孩子<左孩子 j++; if(a[i] < a[j]) //已满足堆序,不需调整 break; //为什么不是continue?因为子树已经排好堆序,结合流程图想想? swap(a[i], a[j]); //交换元素 i = j; j = 2 * i + 1; } } void createHeap(int a[], int n) //建堆 { if (a && n > 1) { for (int i = (n - 2) / 2; i >= 0; i--) //(n-2)/2是最后一个内部节点的下标 heapSiftDown(a, n, i); } }
建堆时间复杂度:
建堆的时间复杂度是O(n),推导比较复杂。下面粘贴出从资料上找到的推导过程:
对于n个节点的堆,其对应的完全二叉树的层数是logn。若i为层数,则第i层上的节点数最多为2^i(i>=0)。建堆时,每个非叶子节点都调用了一次heapSiftDown()函数,并且每个节点最多调整到最底层,即第i层上的节点调整到最底层的调整次数为logn-i(最大的),则建堆的时间复杂度为
以上复杂度分析参考张铭等《数据结构与算法》,推导过程其实并不重要,关键在于我们可以肯定的是建堆是很快的,最多是线性的。
建好堆之后,如何实现堆排序呢?排序之前,我们先看有关堆的两个操作:插入和删除。理解了这两个操作,排序就自然清楚了。堆的插入:插入时总是把新节点插入到堆的最后,并从插入位置向上调整,直到根节点或在此之前已满足堆序。
举个例子解释下这个过程:红色的3是新添的节点。
注意:向上调整的时候,只关注插入位置到根节点的路径,其它路径上的节点是不用调整的。理由很简单:它们已是堆序。这一点可要想清楚了!
向上调整的代码如下:
const int MAX=20; void heapSiftUp(int a[], int n) //向上调整 { int i,j; j = n-1; i = (i-1)/2; //i为j的父节点 while(i>=0) { if(a[j] >= a[i]) break; swap(a[i], a[j]); j = i; i = (j-1)/2; //更精确的写法: i=j%2?(j-1)/2:(j-2)/2; } } void addToHeap(int a[], int n, int data) { /* 前提:数组a已排好堆序且数组还有多余位置存放新节点 */ if(n+1>MAX) { printf("数组已满!无法插入\n"); return; } n++; a[n-1]=data; //把新节点加到最后 heapSiftUp(a, n); }
堆的删除:删除操作总是在堆顶进行(也有的说,可以在任意位置删除,但做法一样),我们把最后一个节点填入待删除位置。然后从该位置向下调整。
同样给个示例图:结合上面以给出的向下调整代码,则很好得到堆删除的代码,为了通用性,我们给出指定位置删除的代码:
void deleteAt(int a[], int &n, int pos) //删除pos位置的节点 { if(pos >= n) { printf("删除的位置不对!\n"); return; } a[pos] = a[n-1]; //把最后一个节点填到待删除位置 n--; heapSiftDown(a, n, pos); //向下调整 }
特别地,删除堆顶就是 deleteAt(a, n, 0);
有了上面的铺垫,堆排序就呼之欲出了。堆排序步骤:
#include<iostream> #include<ctime> using namespace std; void heapSiftDown(int a[], int n, int pos) //从pos位置向下调整 { int i = pos; int j = 2 * i + 1; //j为i的左孩子 while (j<n) { if (j + 1 < n && a[j + 1]<a[j]) //如果右孩子存在,并且右孩子<左孩子 j++; if (a[i] < a[j]) //已满足堆序,不需调整 break; //为什么不是continue?因为子树已经排好堆序 swap(a[i], a[j]); //交换元素 i = j; j = 2 * i + 1; } } void createHeap(int a[], int n) //建堆 { if (a && n > 1) { for (int i = (n - 2) / 2; i >= 0; i--) heapSiftDown(a, n, i); } } void deleteAt(int a[], int &n, int pos) //删除pos位置的节点 { if (pos >= n) { printf("删除的位置不对!\n"); return; } a[pos] = a[n - 1]; //把最后一个节点填到待删除位置 n--; heapSiftDown(a, n, pos); //向下调整 } void HeapSort(int a[], int n) //堆排序 { if (a && n > 1) { createHeap(a, n); while (n > 1) { printf("%4d", a[0]); deleteAt(a, n, 0); } printf("%4d\n", a[0]); } } int main() { printf("******堆排序演练***by David***\n"); printf("原序列\n"); const int N = 12; int *a = new int[N]; srand((unsigned)time(NULL)); for (int i = 0; i < N; i++) { a[i] = rand() % 100; printf("%4d", a[i]); } printf("\n"); printf("经过堆排序\n"); HeapSort(a, N); delete[]a; system("pause"); return 0; }
#include<stdio.h> #include<stdlib.h> #include<time.h> void Swap(int& a, int& b) { if(a!=b) { a ^= b; b ^= a; a ^= b; } } //维护最大堆(从指定位置pos,向下调整) void MaxHeapify(int a[], int n, int pos) { int i, j; i = pos; j = 2 * i + 1; //节点i的左孩子 while (j < n) { if (j + 1 < n && a[j] < a[j + 1]) j++; if (a[i] < a[j]) Swap(a[i], a[j]); i = j; j = 2 * i + 1; } } //构建最大堆 void BuildMaxHeap(int a[], int n) { if (a && n > 1) { int i, j; i = (n - 2) >> 1; while (i >= 0) { MaxHeapify(a, n, i); i--; } } } //堆排序 void HeapSort(int a[], int n) { if (a && n > 1) { //先建堆 BuildMaxHeap(a, n); while (n > 1) { //交换首尾元素 Swap(a[0], a[n - 1]); //堆规模减一 n--; //再次从堆顶调增 MaxHeapify(a, n, 0); } } } int main() { printf("******最大堆实现从小到大排序***by David***\n"); srand((unsigned)time(0)); int a[12]; printf("原序列\n"); for (int i = 0; i < 12; i++) { a[i] = rand() % 100; printf("%4d", a[i]); } printf("\n经过堆排序\n"); HeapSort(a, 12); for (int i = 0; i < 12; i++) printf("%4d",a[i]); printf("\n"); system("pause"); return 0; }
专栏目录看这里: