查找最小的k 个元素

 5.查找最小的k 个元素
题目:输入n 个整数,输出其中最小的k 个。
例如输入1,2,3,4,5,6,7 和8 这8 个数字,则最小的4 个数字为1,2,3 和4。
(参考《编程之美》)
看完题目自己的思路:
    1.要找到最小的k个元素,需要先排序再选择k个最小值。但是时间复杂度至少O(nlog)了
    2.如果用选择排序或交换排序,执行k步,那么时间复杂度为O(k*n),而且需要多次读
看过资料后有下面几种思路:
    1.快速排序,随机找一个元素,一次排序后判断分割成左右两边的l,r  若l.length
      时间复杂度O(n*logk)
    2.当n较大,如100亿时,不能一次性读入内存,所以要求尽可能少的遍历所有数据。
      初始化一个大小为k的数组,并记录当前数组的最大值max,依次读入n个数字,若比max大,continue;若比max小,则插入到数组中,并更新当前的最大值。
       时间复杂度为O(k*n)  但是相比于自己的思路1,减少了遍历n的次数。
    3. 利用hash保存数组中元素Si出现的次数,利用计数排序的思想,线性从大到小扫描过程中,前面有k-1个数则为第k大数,平均情况下时间复杂度O(n)
    4.还有更好的思路吗-----利用堆排序?
      利用堆排序,建立一个大小为k的大顶堆,遍历n个数字,若比堆顶元素小,则取代之,并将堆更新保持大顶堆。  那么只需要遍历一次n,然后输出大小为k的最终的大顶堆。 即为最小的k个数字。O(nlogk)  
      思考:当k也非常大,大小为k的大顶堆无法一次存在内存该如何呢?
      可以先找最小的m(假设内存可存入m大小的堆),得到stack1,然后再建大小为m的堆,找最小的m+1~2*m的数字。遍历n,若比堆顶元素小,并且大于stack1的最大值,则入堆。
      从而可以得出最小的k个数

     具体的选择还是得考虑n,k的大小

思考题:如果是找k到m(o
my answer:利用大顶堆,大小为m的,先找m大的,再在m个数中找前k
          数字比较集中的话,可以用上面的方法3

扩展学习:搜索引擎的排序算法。待学习
                  
     

你可能感兴趣的:(查找最小的k 个元素)