算法通关村15关 | 从10亿数字寻找最小的100万个数字

1. 从10亿数字寻找最小的100万个数字

题目

设计一个算法,给定一个10亿个数字,找出最小的100万个数字,假定计算机内存足以容纳全部10亿个数字。

思路

  1. 先排序所有元素,然后取出前100万个数,时间复杂度为O(nlogn).很明显对于10亿级别的数据空间和时间代价太高。
  2. 选择排序,首先遍历一次找最小,然后再遍历找第三小,直到找到第100万个,时间复杂度太高。
  3. 大顶堆解决,堆原理可以看前面介绍堆的文章,

首先前100万个元素创建一个大顶堆,最大元素位于堆顶,然后遍历整个序列,只有比堆顶元素小的元素才能插入进去,遍历完毕,堆中就是最小的100万个数字。

更新堆的时间复杂度是O(nlogn),占用的空间是100万*4B,大约4MB。

你可能感兴趣的:(算法通关村专栏,算法,数据结构)