数据结构之二叉堆、堆排序

前言

上一篇写了数据结构之二叉搜索树、AVL自平衡树,这次来写堆。

堆的创造者

很久以前排序算法的时间复杂度一直是O(n^2), 当时学术界充斥着“排序算法不可能突破O(n^2)”的声音,直到1959年,由D.L.Shell提出了一种排序算法,希尔排序(Shell Sort),才打破了这种不可能的声音,把排序算法的时间复杂度提升到了O(n^3/2)!

当科学家们知道这种"不可能"被突破之后,又相继有了更快的排序算法,“不可能超越O(n^2)”彻底成为了历史。

在1964年,没错,是55年前!堆排序这种奇思妙想的,十分精彩的,排序算法诞生了!时间复杂度为O(nlogn),远甩O(n^2)

由Robert W. Floyd(罗伯特·弗洛伊德)和J.W.J. Williams(威廉姆斯)共同发明了著名的堆排序,同时也发明了“堆”这样的数据结构, Floyd在1978年获得了图灵奖!真是个狼人!!(比很人还要多一点)

有时候了解下历史,也是十分有趣的!虽然你可能会觉得并没什么卵用~

堆是什么?

之前第一次听到这个词的时候,感觉像是一堆什么东西,完全跟树连想不到一起,后来才知道,原来也是一颗二叉树,而且是完全二叉树

堆的性质:

堆中某个节点的值总是不大于或不小于其父节点的值;
堆总是一棵完全二叉树。

数据结构之二叉堆、堆排序_第1张图片

数据结构之二叉堆、堆排序_第2张图片

如何用数组表示堆?

我们可以把堆,存放在一个数组中,根据索引来获取节点,那么如何通过索引表示父子关系呢?
堆是一颗完全二叉树,所以满足如下条件

假如当前的节点索引为:k
父节点索引:(k-1) / 2
左孩子节点:2 * k + 1
右孩子节点:2 * k + 2

根据这个规律,我们就可以用索引来计算出父子节点的位置了。这样就能把堆存放在数组中使用,会更加节省内存。

堆排序算法

堆排序算法就是形成一个堆后,假如是大顶堆,堆顶肯定是最大的元素,那我们每次都把堆顶的最大元素拿走,然后把堆末尾的元素放到堆顶来,但是这个元素不一定是当前最大的,所以还要对这个元素在堆里进行比较,把最大的元素放到堆顶,再取出来。如此我们每次取出的都是剩余元素中最大的元素,就能得到一组从大到小有序的元素。下面我们来用大顶堆对一组数据进行堆排序计算。

数据为:[50, 10, 90, 30, 70, 40, 80, 60, 20]

算法分为两个部分

1.如何将一组无序的数据构建出一个初始的大顶堆?
2.在拿走堆顶元素之后,如何计算出新的堆顶元素?

首先我们要实现一个操作:如果一个节点的子节点比它更大,就交换位置,如果子节点还有子节点,就要继续比下去,直到末尾。这个操作我们称为:HeapOne

    public void HeapOne(List list, int len, int s)
    {
        int temp, j;
        
        temp = list[s];//先把指定要下沉节点的值取出来
        
        for (j = (2 * s)+1; j < len; j = (j*2)+1)
        {
            if (j < (len - 1) && list[j] < list[j + 1])//看看左右两个子节点谁更大,就取谁
                ++j;
            
            if (temp >= list[j])//子节点比父节点小,就不管
                break;

            list[s] = list[j];//先把子节点的值给父节点
            s = j;//继续从这个子节点往下比较下去
        }
        list[s] = temp;
    }

实现这个操作之后,就可以开始我们的第一个部分了,形成初始大顶堆。

从最后一个非叶子节点开始,对该节点进行HeapOne,一直从下往上,直到把所有的父节点都HeapOne了一遍,一个初始的大顶堆就形成了。

    public void HeapSort(List list)
    {
        int i;
        for (i = (list.Count - 1) / 2; i >= 0; i--)//第一部分,形成一个初始大顶堆
        {
            HeapOne(list, list.Count, i);
        }

        for (i = list.Count -1; i > 0; i--)//每拿走一个元素,都重新计算新堆
        {
            int temp = list[0];
            list[0] = list[i];
            list[i] = temp;
            
            HeapOne(list, i, 0);
        }
    }

算法第二部分

  1. 我们把堆顶的元素取出,放到一个临时变量里存着。
  2. 然后把堆的最末尾元素取出来,放到堆顶。
  3. 把堆的长度-1(因为已经取出之前的堆顶元素了)
  4. 接着对刚刚这个从末尾放到堆顶的元素,进行HeapOne操作,让他跟子节点比较,把最大的元素交换到堆顶来,再次形成最大堆。

一直重复这个操作后,直到最后一个堆顶被取出,放到数组末尾,堆的长度也就为0了,我们的数组也就形成了一组从大到小的数列。

如此,堆排序就完成了

总结

堆排序性能比较稳定,时间复杂度包含初始堆+排序时重建堆为:O(nlogn)。
在游戏开发中也会经常使用到堆

  1. 比如Top K问题,从n个数据中,找出最大的前100个。
  2. 用堆来实现优先加载队列。
  3. A星寻路算法中,可以用最小堆来对寻路的开放列表维护顺序,把f值最小的放在堆顶,每次取出堆顶后,再HeapOne一次就好了。比每次都对开放列表进行排序的性能高的多。

参考

百度百科-堆排序
《大话数据结构》-程杰

你可能感兴趣的:(数据结构之二叉堆、堆排序)