算法与数据结构-堆(二叉堆)

前言

堆(二叉堆),一种动态的树型结构,一种除了底层外,完全被填满二叉树结构。因此,堆一般是基于数组去实现的,它不会出现数组中很多空缺的现象,而造成空间浪费。如下是一个完全二叉树:

完全二叉树

它可以用数组表示为[10,7,2,5,1],若以k表示当前数组的索引,那么:

  • 其父节点:floor((k-1)/2)
  • 其左孩子:2k+1
  • 其又孩子:2k+2

结合上图,堆的性质如下:

  • 堆必须是完全二叉树
  • 任一节点要么比其子树节点大,要么小;
  • 根据上面性质,堆被分为最大堆(大顶堆)和最小堆(小顶堆)。

堆的主要用途:

  • 构建优先队列;
  • 支持堆排序;
  • 快速找出集合中的最大值或最小值。

堆结构的基本操作(以最大堆为例,本文均使用vector容器存储数组,假设vector容器的基本操作时间复杂度为Θ(1)):

  • MaxHeap:维护最大堆的性质,时间复杂度O(nlgn);
  • BuildHeap:从无序的输入数据构造一个最大堆,时间复杂度为O(n);

堆结构的基本操作

1.MaxHeap
输入一个数组A和一个下标i,使不满足最大堆性质的A[i]逐级下降,直到满足。

void MaxHeap(vector &A, int i){
    int max; //存储父节点和其子树节点中的最大值下标
    int lef_child = 2i;      //左孩子
    int rig_child = 2i + 1;  //右孩子
    //左孩子大于父节点
    if(lef_child <= A.size() && A[lef_child] > A[i])
        max = lef_child;   
    else max = i;
    //右孩子更大
    if(rig_child <= A.size() && A[rig_child] > A[max])
        max = rig_child;  
    
    //将最大值上移至父节点
    if(max != i){
        //交换
        int temp = A[i]; A[i] = A[max]; A[max] = temp;
        //更新了数组,需继续查看当前元素是否满足最大堆性质
        MaxHeap(A, max);  
    }
}

因为每一个节点子树节点数(包括孩子的孩子)至多为2n/3(n是整个树的节点数,最坏情况即节点为根节点,且底层大于等于半满),所以该算法的时间复杂度为T(n) <= T(2n/3) + Θ(1)通过主方法求解得T(n)=O(lgn),最后因为含n个元素的堆高为O(lgn),所以其时间复杂度又可以表示为O(h)

2.BuildHeap
可以通过自底向上的方法,从最后一个叶节点开始倒序遍历,并调用MaxHeap判断当前节点子树是否满足最大堆性质。

void BuildHeap(vector &A){
    int i = A.size()/2; //最后一个非叶节点的位置
    for(i; i >= 0; i--)  //自底向上维护
        MaxHeap(A, i);
}

该算法的时间复杂度很容易通过,循环n次,每次调用MaxHeap耗费O(lgn),从而得出T(n)=O(nlgn),虽然正确,但是该算法上界还可以继续紧确。

一个含n个元素的堆高(最底层高为0)为floor(lgn),而该堆最多包含ceil(n/2^(h+1))高度为h的节点。而一个高度为h的节点运行MaxHeap的时间复杂度为O(h),所以可以将BuildHeap的总代价表示为:

BuildHeap的总代价

构建一个优先队列

1.什么是优先队列
优先队列是一种特殊的队列,它不按先进先出的原则,而是以优先度来弹出元素。它本质是一种用来维护由一组元素构成的集合S的数据结构,其中每个元素都有一个相关的值,称为关键字。和堆一样,优先队列也分为最大优先队列和最小优先队列。

2.优先队列的相关操作
HeapTop: 返回并删除掉当前堆顶,时间复杂度为O(lgn)。

int HeapTop(vector &A){
    if(A.size() < 1) exit(0); //没有元素    
    int max = A[0];
    //堆顶等于最后一个值,并将最后一个值弹出
    A[0] = A[A.size()-1];
    A.push_pop();
    //维护最大堆性质
    MaxHeap(A, 0);
    return max;
}

HeapInsert:插入一个元素到当前堆中,时间复杂度为O(lgn)。

void HeapInsert(vector &A, k){
    A.push_back(A[0]);
    A[0] = k;
    //维护最大堆性质
    MaxHeap(A, 0);
}

STL中堆与优先队列的实现

1.堆
heap不属于STL中的容器组件,它是以算法的形式呈现,“默默扮演着幕后英雄”。heap默认是最大堆排序。使用方法如下:

vector ivec{0, 1, 2};
//最大堆[2, 1, 0]
make_heap(ivec.begin(), ivec.end()); 
ivec.push_back(5);
//在堆的基础上进行数据插入[5, 2, 0, 1]
push_heap(ivec.begin(), ivec.end());
//pop_heap并没有删除元素,而是将堆顶元素与最后一个元素进行了替换
//[2, 1, 0, 5]
pop_heap(ivec.begin(), ivec.end());
//删除堆顶的元素[2, 1, 0]
ivec.pop_back();
//默认小堆排序[0, 1, 2]
sort_heap(ivec.begin(), ivec.end());

2.优先队列
priority_queue是STL中优先队列的名称,默认也是最大堆排序。使用方法如下:

priority_queue que;
que.push(x); //每次push之后会自动维护,保证堆顶是优先级别最高的
que.pop();
que.top();

priority_queue还可以自定义存储的数据类型以及排序方式,具体应用可以【关注公众号DoCode,每日一道LeetCode,将零碎时间利用起来】回复关键字“堆”查看。

你可能感兴趣的:(算法与数据结构-堆(二叉堆))