海量数据找到中位数(大堆+小堆)

参考leetcode的原题:查找字节流的中位数

我们分别定义a_max,a_count,b_min,b_count
a_max:表示字节流较小的那一半数字所组成的大顶堆(记为堆a)的堆顶
a_count:表示上述大顶堆元素个数
b_min:表示字节流较大的那一半数字所组成的小顶堆(记为堆b)的堆顶
b_count:表示上述小顶堆元素的个数
其中我们需要保证a_count = b_count或a_count=b_count+1
那么字节流的中位数必定是由a_max和b_min求出
1.若数组个数为奇数,那么中位数为a_max
2.若数组个数为偶数,那么中位数为(a_max+b_min)/2

过程:
1.
遍历数组v[i]
若v[i] < a_max,交换两者
若v[i] > b_min,交换两者
最终得到 a_max < v[i] < b_max
2.
若a_count==b_count,那么将v[i]加入大顶堆a
a_max = v[i]
++a_count
若a_count=b_count+1,那么将v[i]加入小顶堆b
b_min = v[i]
++b_count
3.
最终,中位数一定能从a_max和b_min得到(根据数组个数为奇偶数判断)

时间复杂度:O(N)
空间复杂度:O(1)

你可能感兴趣的:(算法)