剑指offer全集详解python版——数据流中的中位数

题目描述:
如何得到一个数据流中的中位数?如果从数据流中读出奇数个数值,那么中位数就是所有数值排序之后位于中间的数值。如果从数据流中读出偶数个数值,那么中位数就是所有数值排序之后中间两个数的平均值。我们使用Insert()方法读取数据流,使用GetMedian()方法获取当前读取数据的中位数。。

思路:

AVL树是可以的,但工程量大。利用堆也可以。用一个最大堆来维护当前前n/2小的元素,那么每次找中位数只到取出堆顶就可以了。但是,有一个问题,数据要动态增长,有可能之前被替换掉的元素随着元素的增加又跑回来了,所以我们不能单纯得向上题一样把元素丢掉,我们可以再用一个最小化堆来存前n/2大的元素。

代码:

import heapq
class Solution:
    def __init__(self):
        self.max_heap = []
        self.min_heap = []
        self.isfirst=True
 
    def Insert(self, num):
        # write code here
        if not self.min_heap:
            self.min_heap.append(num)
            self.max_heap.append(-num)
        elif self.isfirst and len(self.min_heap) == 1 and len(self.max_heap) ==1:
            self.isfirst = False
            if num > self.min_heap[0]:
                self.min_heap[0] = num
            else:
                self.max_heap[0] = -num
        else:
            if num >= -1*self.max_heap[0]:
                heapq.heappush(self.min_heap, num)
            else:
                heapq.heappush(self.min_heap, -1 * heapq.heappop(self.max_heap))
                heapq.heappush(self.max_heap, -num)
        if len(self.min_heap) - len(self.max_heap) >1:
            heapq.heappush(self.max_heap, -1 * heapq.heappop(self.min_heap))
        elif len(self.max_heap) - len(self.min_heap) >1:
            heapq.heappush(self.min_heap, -1 * heapq.heappop(self.max_heap))           
 
    def GetMedian(self,n=None):
        # write code here
        if len(self.min_heap) == len(self.max_heap):
            return 0.5 * (-1 * self.max_heap[0] + self.min_heap[0])
        elif len(self.min_heap) > len(self.max_heap):
            return self.min_heap[0]
        else:
            return -1 * self.max_heap[0]

你可能感兴趣的:(算法)