堆和堆排序

优先级队列

优先级队列是一个由相同类型的数据元素组成的集合,其中每个数据项都带有一个特定的优先级。它支持insert元素操作,findMin访问优先级最小元素的操作,deleteMin删除优先级最小元素的操作,当然,也可能是支持findMax访问优先级最大元素的操作,deleteMax删除优先级最大元素的操作,以需求而定。
有两种很自然的方法来实现优先级队列:
一种是使用无序队列(数组、向量或链表实现)。两种基本操作的实现方法及时间复杂度如下:

  • 插入:把数据项插入到队尾或队头。时间复杂度:O(1)。
  • 删除:遍历队列找出优先级最高或最低的项,然后删除。时间复杂度:O(n)。
另一种是使用 有序队列(数组、向量或链表实现)。
两种基本操作的实现方法及时间复杂度如下:
  • 插入:基本线性插入排序。时间复杂度:O(n)。
  • 删除:删除队头和队尾的项。时间复杂度:O(1)。
当然,还有一个可能的实现是 二叉查找树,但二叉查找树很容易变得不平衡,这样,插入和删除效率便会大大降低,另外,二叉查找树实现了比优先级队列更多的功能,可以想见,它必然也消耗了更多的资源。所以,将二叉查找树用作优先级队列的实现,实在太大材小用了。
当当当当!我们今天的主角登场了。 堆,或称作二叉堆,是“已知的最优雅的数据结构之一”。堆是实现优先级队列的典型方法,两种基本操作时间复杂度如下:
  • 插入:最坏情况下时间复杂度为O(logn);平均情况下时间复杂度为O(1),业已证明,执行一次插入平均需要 2.607 次比较,因此平均 insert 操作上移元素 1.607层。
  • 删除:在平均情况和最坏情况下时间复杂度均为O(logn)。
表现简直完美!STL中的priority_queue类模板就是采用二叉堆来实现的。

堆是符合下列性质的二叉树:

  1. 结构属性:堆是一棵完全树。
  2. 顺序属性:每个结点中的数据项都大于或等于儿子的数据项。
以上的顺序结构是针对最大堆而言的,最小堆的叙述则恰好相反。下面的讲解都默认为最大堆。
一般采用数组或向量来实现堆,初次接触这个事实可能会感到奇怪,因为我们所接触过的树结构都是使用链式结构来实现的。采用数组或向量来实现堆效率更高,这主要是因为堆没有在中间位置删除和插入元素的需求,另外堆是一棵完全树,方便索引。
一个最大堆结构如下图所示,它既是一棵二叉树,也是一个数组。

我们来看看堆的基本操作:
1、 插入操作(insert)
插入操作的过程很简单:将新数据插入到堆的下一个空位,然后向上渗透直到二叉树重新满足堆的顺序属性为止。

实现代码:

//插入操作在平均情况下花费常量时间,在最坏情况下花费对数时间
//业已证明,执行一次插入平均需要 2.607 次比较,因此平均 insert 操作
//上移元素 1.607层。
template
void BinaryHeap::insert(const T& value)
{
    if(theSize+1==theArray.size())
        theArray.resize(theArray.size()*2);
    int hole = ++theSize;
    //hole==1时已是最高点,不可向上渗透了。
    for(;value1;hole/=2)
        theArray[hole] = theArray[hole/2];
    theArray[hole] = value;
}

2、下滤操作(percolate down)
近似堆的定义是,二叉树根结点的左右子树均为堆,但整体不满足堆的顺序属性。下滤操作是把近似堆调整为堆的过程。
该过程也很简单:找到一个较大的儿子,如果该结点比儿子小,则和儿子交换位置。重复上述过程直到二叉树满足堆的顺序属性。
下图展示了对结点2进行下滤操作的过程。

实现代码:

template
void  BinaryHeap::percolateDown(int hole)
{
    int child;
    T temp = theArray[hole];
    for (;hole*2<=theSize;hole=child)
    {
        child = hole*2;
        if(child!=theSize && theArray[child+1]

我并没有单独列出删除操作(delete),这是因为删除操作主要过程就是下滤操作:删除根结点,将堆最后面的数据项复制到根结点,执行下滤操作。
实现代码:

//删除操作在平均情况和最坏情况下都需要对数时间
template
void BinaryHeap::deleteMin()
{
    if(isEmpty())
        throw exception();
    theArray[1]=theArray[theSize--];
    percolateDown(1);
}
 

3、 建堆操作(build heap)
建堆操作是把一棵完全二叉树转换成堆。这是堆排序中的关键操作。该操作的具体过程为:从最后一个非叶子节点开始到根结点,依次执行下滤操作。
下图展示了构建一个最大堆的过程。

实现代码:

template
void BinaryHeap::buildHeap()
{
    for(int i=theSize/2;i>0;--i)
        percolateDown(i);
}

点击此处查看最小堆类模板完整源代码

堆排序

顾名思义,堆排序是利用堆的特性来对一组数据进行排序。堆排序可分为以下个步骤(从小到大排序):

  1. 对所有n个数据进行建堆(最大堆)操作。
  2. 将堆顶元素和堆尾元素交换,对剩下的n-1个数据进行建堆(最大堆)操作。
  3. 重复步骤2直至堆的大小为1,此时数据完成排序。
有两个问题需要重视:
  1. 被排序的数据从0开始索引,所以父亲和孩子的位置都有了相应的变化。父亲的位置由i/2变为(i-1)/2,左孩子的位置由2i变为2i+1,右孩子的位置由2i+1变为2i+2。
  2. 下滤操作需要知道当前堆的大小。

实现代码:

template
void percolateDown(vector& vec,int i,int length)
{
    int child;
    T temp = vec[i];
    for(;2*i+1<=length-1;i=child)
    {
        child = 2*i+1;
        if(childtemp)
            vec[i] = vec[child];
        else
            break;
    }
    vec[i] = temp;
}
 
template
void heapSort(vector& vec)
{
    for(int i = vec.size()/2;i>=0;--i)
        percolateDown(vec,i,vec.size());
    for (int j = vec.size()-1;j!=0;--j)
    {
        swap(vec[0],vec[j]);
        percolateDown(vec,0,j);
    }
}
 
void main()
{
    int a[]={312,33,44,5,6,4,2,3,4,5,6,76,8,6,88768,5345,43,432};
    vector vec(a,a+sizeof(a)/sizeof(*a));
    for (int i=0;i!=vec.size();++i)
        cout<

在PercolateDown算法中,在每一个阶段中考虑的项的数目是前一阶段的一半。因此,与二叉查找树的情况类似,这个算法的最坏计算时间是O(logn)。由于BuildHeap操作执行了n/2次PercolateDown操作,其最坏计算时间是O(nlogn)。HeapSort执行一次BuildHeap操作和n-1次PercolateDown操作,因此其最坏计算时间是O(nlogn)。

声明:文中三幅插图来自《算法导论》第三版英文版。

欢迎大家访问我的独立技术博客 道合|SameIdeal.com

你可能感兴趣的:(堆和堆排序)