面试题 41. 数据流中的中位数 Python3 大顶堆,小顶堆

题目

如何得到一个数据流中的中位数?如果从数据流中读出奇数个数值,那么中位数就是所有数值排序之后位于中间的数值。如果从数据流中读出偶数个数值,那么中位数就是所有数值排序之后中间两个数的平均值。

例如,

[2,3,4] 的中位数是 3

[2,3] 的中位数是 (2 + 3) / 2 = 2.5

设计一个支持以下两种操作的数据结构:

void addNum(int num) - 从数据流中添加一个整数到数据结构中。
double findMedian() - 返回目前所有元素的中位数。
示例 1:

输入:
["MedianFinder","addNum","addNum","findMedian","addNum","findMedian"]
[[],[1],[2],[],[3],[]]
输出:[null,null,null,1.50000,null,2.00000]
示例 2:

输入:
["MedianFinder","addNum","findMedian","addNum","findMedian"]
[[],[2],[],[3],[]]
输出:[null,null,2.00000,null,2.50000]
 

限制:

最多会对 addNum、findMedian 进行 50000 次调用。

思路1

  • 使用列表作为数据结构:
  • addnum 等价于 append + sort
  • findMedian则根据当前list的长度计算中位数。

代码

from heapq import *

class MedianFinder:
    def __init__(self):
        self.A = []

    def addNum(self, num: int) -> None:
        self.A.append(num)
        self.A.sort()

    def findMedian(self) -> float:
        lengthA = len(self.A)
        if lengthA == 0:
            return
        elif lengthA % 2 == 0:
            return (self.A[int(lengthA/2-1)]+self.A[int(lengthA/2)]) / 2 
        else:
            return (self.A[int(lengthA/2)])


# Your MedianFinder object will be instantiated and called as such:
# obj = MedianFinder()
# obj.addNum(num)
# param_2 = obj.findMedian()

因为每添加一个元素都需要进行快速排序,时间复杂度为O(NlogN);其他步骤复杂度为O(1);

结果

面试题 41. 数据流中的中位数 Python3 大顶堆,小顶堆_第1张图片

结果并不好

 

思路2

使用堆作为数据结构以提高时间复杂度:

小顶堆:存储数组中较大的一半数,因此作为最小的元素,堆顶即在中位数附近;

大顶堆:存储数组中较小的一半数,因此作为最大的元素,堆顶即在中位数附近。

计算中位数时只需要根据数组长度选择堆顶元素/ 堆顶元素的平均值即可。

代码

from heapq import *

class MedianFinder:
    def __init__(self):
        self.A = [] # 小顶堆,保存较大的一半
        self.B = [] # 大顶堆,保存较小的一半

    def addNum(self, num: int) -> None:
        if len(self.A) != len(self.B):
            heappush(self.A, num)
            heappush(self.B, -heappop(self.A))
        else:
            heappush(self.B, -num)
            heappush(self.A, -heappop(self.B))

    def findMedian(self) -> float:
        if len(self.A) != len(self.B):
            return self.A[0]
        else:
            return (self.A[0] - self.B[0]) / 2.0

时间复杂度

堆的插入和弹出操作: O(logN) 。其余为O(1)

结果

面试题 41. 数据流中的中位数 Python3 大顶堆,小顶堆_第2张图片

 

 

 

 

你可能感兴趣的:(#,Leetcode,leetcode,中位数,大顶堆,小顶堆,python)