python--堆(heap)与堆排序

什么是堆

堆是一种完全二叉树,有最大堆和最小堆两种

1.最大堆:对于每个非叶子节点V, V的值都比它的两个孩子大,称为 最大堆特性(heap order property)最大堆里的根总是存储最大值, 最小的值存储在叶节点
2.最小堆:和最大堆相反,每个非叶子节点V,V的两个孩子的值都比它大

python--堆(heap)与堆排序_第1张图片

关于堆的操作

堆提供了很有限的几个操作:

1.插入新的值。插入比较麻烦的就是需要维持堆的特性。需要sift-up操作,具体在代码中实现
2.获取并移除根节点的值。每次我们都可以获取最大值或最小值。这个时候需要把底层最右边的节点值替换到root节点之后执行sift-down操作

堆的表示

这里用数组实现堆

python--堆(heap)与堆排序_第2张图片

仔细观察下,因为完全二叉树的特性,树不会有间隙。对于数组里的一个下标 i ,我们可以得到它的父亲和孩子的节点对应的下标:

parent = int( (i-1) / 2 ) #取整
left = 2 * i +1
right = 2 * i + 2
超出下标表示没有对应的孩子节点

代码实现

关于add()方法的实现原理

python--堆(heap)与堆排序_第3张图片

关于siftup()递归操作的原理图

python--堆(heap)与堆排序_第4张图片

关于extract()方法的原理图

python--堆(heap)与堆排序_第5张图片


# -*- coding:utf-8 -*-

####################################
    # heap 实现
####################################

class Array(object):
    def __init__(self,size=32):
        self._size = size
        self._items = [None] * size

    def __getitem__(self,index):
        return self._items[index]

    def __setitem__(self,index,value):
        self._items[index] = value

    def __len__(self):
        return self._size

    def clear(self,value=None):
        for i in range(self._items):
            self._items[i] = value

    def __iter__(self):
        for item in self._items:
            yield item


'''
    初始化堆结构
'''
class MaxHeap(object):
    def __init__(self,maxsize=None):
        self.maxsize = maxsize
        self._elements = Array(maxsize)
        self._count = 0

    def __len__(self):
        return self._count

    def add(self,value):
        if self._count >= self.maxsize:
            raise Exception('full')
        #将插入的值value给数组最后一值
        self._elements[self._count] = value
        #堆的容量加一
        self._count += 1
        self._siftup(self._count-1)

    def _siftup(self,ndx):      #递归交换直到满足最大堆特性
        if ndx > 0:
            #获取添加节点的父节点的下标值
            parent = int((ndx-1)/2)
            #如果添加节点的值大于父节点的值
            if self._elements[ndx] > self._elements[parent]:
                self._elements[ndx],self._elements[parent] = self._elements[parent],self._elements[ndx]
                self._siftup(parent)




    def extract(self):
        if self._count <= 0:
            raise Exception('empty')
        #获取根节点的值
        value = self._elements[0]
        #将堆最后一个叶子节点作为root节点
        self._elements[0] = self._elements[self._count]
        self._siftdown(0)
        return value

    def _siftdown(self,ndx):
        #获取左右孩子节点的下标
        left = 2 * ndx + 1
        right = 2 * ndx + 2
        #默认ndx为最大
        largest = ndx

        if(left < self._count and   #有左孩子
            self._elements[left] >= self._elements[largest] and
            self._elements[left] >= self._elements[right]):     #左孩子 > 右孩子
            largest = left

        elif right < self._count and self._elements[right] >= self._elements[largest]:
            largest = right

        if largest != ndx:
            self._elements[ndx],self._elements[largest] = self._elements[largest],self._elements[ndx]
            self._siftdown(largest)

def test_max_heap():
    import random
    n = 5
    h = MaxHeap(n)
    for i in range(n):
        h.add(i)
    for i in reversed(range(n)):
        assert i == h.extract()



'''
    实现堆排序
    上面我们实现了最大堆,每次我们都能extract一个最大的元素了,于是一个倒序排序函数就能很容易写出来了:
'''
def heapsort_reverse(array):
    length = len(array)
    maxheap = MaxHeap(length)
    for i in array:
        maxheap.add(i)
    res = []
    for i in range(length):
        res.append(maxheap.extract())
    return res


def test_heapsort_reverse():
    import random
    l = list(range(10))
    random.shuffle(1)
    assert heapsort_reverse(l) == sorted(l,reverse=True)






关于 python 里的 heapq

python 其实自带了 heapq 模块,用来实现堆的相关操作,原理是类似的,可以阅读相关文档

练习

1.尝试实现一个最小堆
2.我们实现的堆排序是inplace的吗,如果不是,你能改成inplace的吗?
3.这里我们用最大堆实现了一个heapsort_reverse函数,请你实现一个正序排序的函数.似乎不止一种方式

你可能感兴趣的:(个人总结)