优先队列之二叉堆与d-堆

二叉堆简介

平时所说的堆,若没加任何修饰,一般就是指二叉堆。同二叉树一样,堆也有两个性质,即结构性和堆序性。正如AVL树一样,对堆的以此操作可能破坏者两个性质中的一个,因此,堆的操作必须要到堆的所有性质都被满足时才能终止。

结构性质

堆是一棵完全填满的二叉树,因为完全二叉树很有规律,所以它可以用一个数组表示而不需要指针。如下图所示,图2中的数组对应图1中的堆。

                            

图1:二叉堆                                                                                   图2:二叉堆的数组存储

对于任意位置i上的元素,其左儿子在位置2i处,右儿子在位置2i+1处,而它的父亲在i/2。因此,不仅指针这里不需要,而且遍历该树所需要的操作也十分简单。这种表示法的唯一问题在于:最大的堆大小需要事先估计,但对于典型的情况者并不成问题,图2中堆的大小是13个元素。该数组有一个位置0,用做哨兵,后面会有阐述。

因此,一个堆的数据结构将由一个数组,一个代表最大值的整数以及当前堆的大小组成。代码如下:

struct HeapStruct
{
	int Capacity;
	int Size;
	ElementType *Elements;
};

堆序性质

使操作能快速执行的性质是堆序性。在一个堆中,对于每个节点X,X的父亲中的关键字小于(或等于)X中的关键字,根节点除外(根节点没有父亲)。图3中,左边的是堆,右边的不是(虚线表示堆序性质被破坏)。

        图3:两棵完全二叉树

基本操作

Insert(插入):

为了将一个元素X插入到堆中,我们在下一个空闲位置创建一个空穴,否则该堆将不是完全树。如果X可以放入到该空穴中,那么插入完成。否则,我们把空穴的父节点上的元素移入该空穴中,这样,空穴就朝着根的方向上行一步。继续该过程直到X能被放入到空穴中为止。图4表示,为了插入14,我们在堆的下一个可用位置建立一个空穴,由于将14插入空穴破坏了堆序性质,因此将31移入该空穴,图5继续这种策略,直到找到14的正确位置。

               

 图4:创建一个空穴,再将空穴上冒                                       图5:将14插入到前面的堆中的其余两步

这种策略叫做上虑。新元素在堆中上虑直到找出正确的位置;使用如下代码,很容易实现。

void Insert( ElementType X, PriorityQueue H )
{
	if (IsFull(H)){
		printf("Priority queue is full!");
		return;
	}
	int i;
	for (i = ++H->Size; H->Elements[i/2] > X; i /= 2){
		H->Elements[i] = H->Elements[i/2];
	}
	H->Elements[i] = X;
}

如果要插入的元素师新的最小值,那么它将一直被推向顶端,这样在某一时刻,i将是1,我们就需要令程序跳出while循环。当然可以通过明确的测试做到这一点。不过,这里采用的是把一个很小的值放到位置0处以使while循环终止,这个值必须小于堆中的任何值,称之为标记或哨兵。这类似于链表中头结点的使用。通过添加的这个标记,避免了每次循环都要执行一次测试,这是简单的空间换时间策略。

DeleteMin(删除最小元):

找出最小元是很容易的;困难的部分是删除它。当删除一个最小元时,在根节点处产生了一个空穴。由于现在堆少了一个元素,因此对中最后一个元素X必须移到该堆的某个地方。如果X可以被放入空穴中,那么DeleteMin完成。不过这一般都不可能,因此我们将空穴的两个儿子中较小者移入空穴中,这样就把空穴向下推了一层,重复该步骤,知道X可以被放入空穴中。因此,我们的做法是将X置入沿着从根开始包含最小儿子的一条路径上的一个正确的位置。

图6显示DeleteMin之前的堆,删除13之后,我们必须要正确的将31放到堆中,31不能放在空穴中,因为这将破坏堆序性质,于是,我们把较小的儿子14置入空穴,同时空穴向下滑一层,重复该过程,把19置入空穴,在更下一层上建立一个新的空穴,然后26置入空穴,在底层又建立一个新的空穴,最后,我们得以将31置入空穴中。这种策略叫做下虑。

                    

图6 在根处建立空穴                                                             图7:将空穴下滑一层 

 

 图8:空穴移到底层,插入31

代码实现

头文件:binheap.h

typedef int ElementType;

#ifndef _BINHEAP_H
#define _BINHEAP_H

struct HeapStruct;
typedef struct HeapStruct *PriorityQueue;

PriorityQueue Initialize( int MaxElements );
void Destroy( PriorityQueue H );
void MakeEmpty( PriorityQueue H );
void Insert( ElementType X, PriorityQueue H );
ElementType DeleteMin( PriorityQueue H );
ElementType FindMin( PriorityQueue H );
int IsEmpty( PriorityQueue H );
int IsFull( PriorityQueue H );

#endif

实现文件:binheap.c

#include "binheap.h"
#include 
#include 

#define MinPQSize 10
#define MinData -32767	

struct HeapStruct
{
	int Capacity;
	int Size;
	ElementType *Elements;
};

PriorityQueue Initialize( int MaxElements )
{
	if (MaxElements < MinPQSize){
		printf("Priority queue is too small!\n");
		return NULL;
	}
	PriorityQueue H;
	H = malloc(sizeof(struct HeapStruct));	//为整个堆分配空间,其实大小只有12字节
	if (H == NULL){                         //两个int共8个字节,加上指针4个字节
		printf("Out of space!");
		return NULL;
	}
	H->Elements = malloc(sizeof(ElementType) * (MaxElements + 1));   //为该指针指向的数组分配空间
	if (H->Elements == NULL){
		printf("Out of space!");
		return NULL;
	}
	H->Capacity = MaxElements;
	H->Size = 0;
	H->Elements[0] = MinData;	//留出一个元素,作为哨兵;
	return H;
}

void MakeEmpty( PriorityQueue H )
{
	H->Size = 0;
}

void Insert( ElementType X, PriorityQueue H )
{
	if (IsFull(H)){
		printf("Priority queue is full!");
		return;
	}
	int i;	//若位置0没有存放标记,那么for循环的判断条件该改为:H->Elements[i/2] > X && i != 0
	for (i = ++H->Size; H->Elements[i/2] > X; i /= 2){	//遍历所有非树叶节点(在位置i/2处),比较它的值与X的大小
		H->Elements[i] = H->Elements[i/2];              //若X大于它,表明X可以作为它的新孩子,否则,就进行上虑
	}
	H->Elements[i] = X;
}

ElementType DeleteMin( PriorityQueue H )
{
	if (IsEmpty(H)){
		printf("Priority queue is full!");
		return H->Elements[0];
	}
	int i, child;
	ElementType MinElement, LastElement;
	MinElement = H->Elements[1];
	LastElement = H->Elements[H->Size--];

	for (i = 1; i * 2 < H->Size; i = child){		//还是遍历所有的非树叶节点
		child = i * 2;
		if (child != H->Size && H->Elements[child] > H->Elements[child+1])
			++child;								//找出每个节点的最小儿子
		if (LastElement > H->Elements[child])       //若最后一个值比这个最小儿子还要小,表明它可以放入空穴中,
			H->Elements[i] = H->Elements[child];    //作为这个最小儿子的新父亲,若比它大,表明最后一个
		else                                        //值不能放入这个空穴中,空穴下移
			break;
	}
	H->Elements[i] = LastElement;
	return MinElement;
}

ElementType FindMin( PriorityQueue H )
{
	if (!IsEmpty(H)){
		return H->Elements[1];	//位置0存放的是标记,值为-32767
	}
	printf("Priority queue is Empty!");
	return H->Elements[0];
}

int IsFull( PriorityQueue H )
{
	return H->Size == H->Capacity;
}

int IsEmpty( PriorityQueue H )
{
	return H->Size == 0;
}

void Destroy( PriorityQueue H )
{
	free(H->Elements);
	free(H);
}

d-堆

二叉堆因为实现简单,因此在需要优先队列的时候几乎总是使用二叉堆。d-堆是二叉堆的简单推广,它恰像一个二叉堆,只是所有的节点都有d个儿子(因此,二叉堆又叫2-堆)。下图表示的是一个3-堆。注意,d-堆要比二叉堆浅得多,它将Insert操作的运行时间改进为 。然而,对于大的d,DeleteMin操作费时得多,因为虽然树浅了,但是d个儿子中的最小者是必须找到的,如果使用标准算法,将使用d-1次比较,于是将此操作的时间提高到 。如果d是常数,那么当然两种操作的运行时间都为 O(logN)。虽然仍可以使用一个数组,但是,现在找出儿子和父亲的乘法和除法都有个因子d,除非d是2的幂,否则会大大增加运行时间,因为我们不能再通过二进制移位来实现除法和乘法了。D-堆在理论上很有趣,因为存在许多算法,其插入次数比删除次数多得多,而且,当优先队列太大不能完全装入内存的时候,d-堆也是很有用的,在这种情况下,d-堆能够以与B-树大致相同的方式发挥作用。

除了不能执行Find操作外(指以对数执行),堆的实现最明显的两个缺点是:将两个堆合并成一个堆是很困难的。这种附加的操作叫做Merge。存在许多实现堆的方法使得Merge操作的运行时间为O(logN),如下篇介绍的左式堆。



你可能感兴趣的:(数据结构(C))