【堆】A013_LC_数据流的中位数(分析数据量的奇偶性+抽象两个堆为数据流的左右部分)

中位数是有序列表中间的数。如果列表长度是偶数,中位数则是中间两个数的平均值。例如,

[2,3,4] 的中位数是 3
[2,3] 的中位数是 (2 + 3) / 2 = 2.5

设计一个支持以下两种操作的数据结构:

  • void addNum(int num) - 从数据流中添加一个整数到数据结构中。
  • double findMedian() - 返回目前所有元素的中位数。
addNum(1)
addNum(2)
findMedian() -> 1.5
addNum(3) 
findMedian() -> 2

进阶:
如果数据流中所有整数都在 0 到 100 范围内,你将如何优化你的算法?
如果数据流中 99% 的整数都在 0 到 100 范围内,你将如何优化你的算法?

方法一:堆

思路

只想到暴力排序,参考别人的堆思路:如果把数据分为两部分,中位数就是 (前半部分的 maxVal + 后半部分的 minVal) / 2,接下来就是讨论数据流的数量量的奇偶性:

  • 为奇数时,从 max_heap 或 min_heap 中任取一个堆顶元素都是答案
    • 这也意味着当 max_heap.size() + min_heap.size() 为偶数时,将数据放哪个堆都行
  • 为偶数时,因为我们要取的是中位数,所以我们希望从小顶堆(即数据流的右半部分)取出元素时,尽量取大的;而从大顶堆(即数据流的左半部分)取出元素时,尽量取小的,故:
    • 小根堆存 > 中位数的数,大根堆存 ≤ 中位数的数
    • max_haep.size = min_headp.size / min_headp.size+1,这样当数据流为奇数时,可以从小根堆中 pop 出中位数
class MedianFinder {
     
    Queue<Integer> minQ, maxQ;
    int tot;
    public MedianFinder() {
     
        minQ=new PriorityQueue<>();
        maxQ=new PriorityQueue<>(Collections.reverseOrder());
    }
    
    public void addNum(int num) {
     
        maxQ.add(num);
        minQ.add(maxQ.poll());
        if (minQ.size() > maxQ.size()) {
     
            maxQ.add(minQ.poll());
        }
        tot++;
    }
    
    public double findMedian() {
     
        return (tot&1)==1 ?  maxQ.peek() : (minQ.peek()+maxQ.peek())*0.5;
    }
}

复杂度分析

  • Time O ( l o g n ) O(logn) O(logn)
  • Space O ( l o g n ) O(logn) O(logn)

你可能感兴趣的:(【堆】A013_LC_数据流的中位数(分析数据量的奇偶性+抽象两个堆为数据流的左右部分))