堆、堆排序与优先队列

堆的一个非常典型的应用就是优先队列,在说堆之前我们先说下,什么是优先队列?

普通的队列我们知道,就是由入队时间的顺序来决定出队的顺序,先进先出后进后出。这种规则满足我们生活中大多数场景,比如超市结账地铁进站等等,而优先队列则是出队的顺序和入队的顺序无关,而和优先级有关,比如医院排队就诊,有120送来的急诊患者肯定优先级最高要第一时间就诊。而在计算机中优先队列则被大量的使用,系统要同时执行多个任务,在执行时是将CPU的执行周期划成了时间片,在每个时间片里只能执行一个任务,执行哪一个任务就是取决于任务的优先级,系统会动态的选择当前优先级最高的任务来执行。所以此时就用到了优先队列,将所有需要执行的任务入列,由优先队列来选择优先级最高的任务。

可能此时有人会问,如果将所有任务按优先级进行一次排序不就可以吗?可现实是,当我们执行完一个任务之后,此时可能会再来好几个不同优先级的任务,而且刚刚拍好序的任务的优先级可能也会改变(原本很紧急,突然变得不紧急了),如果每次选择任务前都对任务进行一次排序,这样的耗时是很巨大的。

此时我们知道了优先队列的必要性,那么实现优先队列为什么要用堆呢?我们看下图


堆、堆排序与优先队列_第1张图片
图1.png

如果我们用普通的数组,那么入队时很简单直接随便放入数组,只需要O(1)的时间,然而在出队时要挑选最大的那个优先级,则需要O(n)的时间。同样如果是有序的数组,入队时需要维护这个数组的有序性,找到此优先级合适的位置,需要O(n)的时间,出队就很简单只需要拿出数组第一个就好了。而如果使用堆的话,则可以非常好的平衡入队与出队的时间复杂度。使用堆可以将入队与出队的时间复杂度都变成lg(n)级别,虽然使用堆在入队上是慢于普通数组,在出队上是慢于有序数组的,可是平均来讲,使用堆来实现优先队列的时间复杂度大大低于我们使用数组来实现。

堆的定义

堆是一种特殊的数据结构,最为经典的实现是二叉堆,它是一棵完全二叉树。二叉树长这样
堆、堆排序与优先队列_第2张图片
图2.png

这个二叉树特点就是树里的任何一个节点都不大于它的父节点,并且他是一个完全二叉树。所谓完全二叉树就是,除了最后一层以外,其他的层的节点必须是最大值。也就是说这一层没有装满,你就不能开下一层。而且最后一层剩余的节点,必须集中在左侧(如下图)。这样堆我们也称为最大堆,因为树顶的那个元素总是最大的那个值。反之同样也有最小堆

堆、堆排序与优先队列_第3张图片
图3.png

堆的实现

既然堆是一个树形结构,我们可以像其他普通的树形结构一样,创建节点的对象,这个对象有两个指针,指向它的左孩子和右孩子。但对于堆而言我们可以用数组来存储一个堆。我可以用编号来标记每一个节点。

堆、堆排序与优先队列_第4张图片
图4.png

我们可以看出, 节点的序号乘以2就是它左孩子的节点,节点序号乘以2加1就是右孩子的节点。所以我们可以归纳出,在第一个节点用1来标记的情况下,节点 i 它的父节点为 i/2,左孩子节点为i*2,右孩子i*2+1。
Ps:从1开始标记是比较常用的实现方式,你也可以从0开始,相应的表达式也有改变。节点 i 的父节点为 (i-1)/2 , 左孩子为2*i+1 、右孩子2*i+2。

上浮操作 shift up

当我们需要向一个最大堆添加一条新的数据时,此时我们的堆变成了这样。

堆、堆排序与优先队列_第5张图片
图5.png

此时,由于新数据的加入已经不符合最大堆的定义了。所以我们需要对新加入的数据进行shift up操作,将它放到它应该在的位置。shift up操作时我们将新加入的数据与它的父节点进行比较。如果比它的父节点大,则交换二者。
堆、堆排序与优先队列_第6张图片
图6.png

并且不断的重复这个操作,将它与父节点比较,直到它不大于父节点,或者它没有父节点(到顶了)。
堆、堆排序与优先队列_第7张图片
图7.png

此时我们就完成了 对新加入元素的 shift up操作。
伪代码如下

  void shiftUp(int i) {
        while(i>1 && array[i/2]

下沉操作 shift down

当我们从堆中(也就是优先队列中)取出一个元素时。我们是将堆顶的元素弹出。(只能从堆顶取出)


堆、堆排序与优先队列_第8张图片
图8.png

此时这个堆没有顶了,那么该怎么办呢?我们只需要把这个堆最后一个元素放到堆顶就可以了。


堆、堆排序与优先队列_第9张图片
图9.png

堆、堆排序与优先队列_第10张图片
图10.png

此时这个堆已经不符合最大堆的性质。为了保持这个性质,我们需要将堆顶的元素调整到它应该在的位置。也就是对它进行shift Down操作。在shift down时,因为它有左右孩子两个节点,所以我们需要将左右两个孩子节点进行比较,在得到较大的节点之后,再与它进行比较,如果它的子节点大,则将二者交换。并且不断的重复这样的操作,直到它没有叶子节点或者大于叶子节点停止

堆、堆排序与优先队列_第11张图片
图11.png

堆、堆排序与优先队列_第12张图片
图12.png

此时我们就完成了弹出一个元素之后的shift down操作。

伪代码如下

void  shiftDown(int i) {
  while(2*i <= array.count){
    int j = 2*i;//需要交换的目标索引,初始为左孩子的
    if(j+1 <= array.count && array[j+1]>array[j]) {//需要判断此节点有没有右孩子
      j += 1;
    }
    if(array[i] >= array[j]) {//此时子节点没有大于父节点直接跳出
      break;
    }
    swap(array[i] , array[j]);
    i = j;
  }
}

堆排序

堆排序(heap sort)是利用堆这种数据结构,来进行排序的一种算法。

首先将一个数组抽象成一个堆。这个过程,我们称之为heapify

堆、堆排序与优先队列_第13张图片
图13.png

之后我们找到这个堆中第一个非叶子节点,这个节点的位置始终是数组的数量除以2,也就是索引5位置的27,从这个节点开始,对每一个非叶子的节点,,进行shift down操作。

27比它的子节点51要小,所以交换二者。


堆、堆排序与优先队列_第14张图片
图14.png

之后对索引4位置的11,以及索引3位置的25,继续进行shift down。


堆、堆排序与优先队列_第15张图片
图15.png
堆、堆排序与优先队列_第16张图片
图16.png

接下来我们看索引2位置的20。首先呢,我们需要将20与它两个子节点中较大的51交换。
堆、堆排序与优先队列_第17张图片
图17.png

此时,还没有完,shift down操作是直到它没有叶子节点或者大于叶子节点时才停止。
所以我们需要继续将20与它的子节点27进行比较。

堆、堆排序与优先队列_第18张图片
图18.png

索引2才算操作完成了。
最后继续对索引1位置的14,以此类推进行shiftdown。整个堆就操作完成。使用的时候每次取出堆顶的元素,整个数组就是排序完成的了。
堆、堆排序与优先队列_第19张图片
图19.png

如果觉得作者对哪里的理解有偏差,希望不吝赐教,留言指正。谢谢支持~

你可能感兴趣的:(堆、堆排序与优先队列)