【问题描述】
假设需要我们在一堆海量数据中找出排名前k的数据;最好的方法是用最小堆排序,直接用前k个数据建立一个小顶堆,然后遍历剩余的数,
①如果此数<堆顶元素【说明:比k个数中最小的数还要小】,直接跳过此数,遍历下一个数;
②如果此数>堆顶的数,则将此数和堆顶的数交换,然后从堆顶向下调整堆,使其重新满足小顶堆。
【说明】堆的存储
一般用数组来表示堆,第i个节点的父节点下标为i/2-1;它的左右节点下标分别为:2*i+1和2*1+2
【代码】
一、从第i个点向下调整堆的过程
// 从i节点开始向下调整,n为节点总数,从i开始计算 i节点的子节点为 2*i+1, 2*i+2
void MinHeapDown(int a[], int i, int n)
{
int j, temp;
temp = a[i];
j = 2 * i + 1;
while (j < n)
{
if (j + 1 < n && a[j + 1] < a[j]) //在左右孩子中找最小的
j++;
if (a[j] >= temp)
break;
a[i] = a[j]; //把较小的子结点往上移动,替换它的父结点
i = j;
j = 2 * i + 1;
}
a[i] = temp;
}
【说明】从最后一个非叶节点开始,追个进行向下调整操作,保证当前节点的所有子节点是满足最小堆的,然后一直到根节点,保证这个堆是满足小顶堆的
//建立最小堆
void MakeMinHeap(int a[], int n)
{
for (int i = n / 2 - 1; i >= 0; i--)
MinHeapDown(a, i, n);
}
//如果当前值key>堆顶元素,则进行替换操作,然后进行向下调整
void MinHeapReplaceHeader(int a[], int n,int key)
{
a[0] = key;
MinHeapDown(a, 0, n);
}
void MinHeapDeleteNumber(int a[], int n)
{ for(int i=n-1;i>=0;i--){
//每次输出一个最小值后的调整过程
Swap(a[0], a[i]);
MinHeapDown(a, 0, i);
}
//进行遍历,输出最终k个值的过程
for(int i=n-1;i>=0;i--)
printf("%d ",a[i]);
}
【话外音】
当然,若数据不是很大,也可以用快排先进行排序,然后直接输出前k个最大的数;数据量大的情况下,不提倡排序