topK问题(大顶堆、快速选择算法)

topK问题:有 N (N>1000000)个数,求出其中的前K个最小的数。
力扣原题:最小的k个数
输入整数数组 arr ,找出其中最小的 k 个数。

方法一:大顶堆
思路:维护一个大小为k的大顶堆,遍历一次数组,初始插入k个数,然后每遍历一个数,将其与堆顶比较,若比堆顶小,则堆顶弹出,该数入堆。

class Solution {
public:
    vector<int> getLeastNumbers(vector<int>& arr, int k) {
        vector<int>vec(k, 0);
        if (k == 0) return vec; // 排除 0 的情况
        priority_queue<int>Q;
        for (int i = 0; i < k; ++i) Q.push(arr[i]);
        for (int i = k; i < (int)arr.size(); ++i) {
            if (Q.top() > arr[i]) {
                Q.pop();
                Q.push(arr[i]);
            }
        }
        for (int i = 0; i < k; ++i) {
            vec[i] = Q.top();
            Q.pop();
        }
        return vec;
    }
};

时间复杂度:O(nlgk),维护堆花费O(lgk)时间,最坏情况插入n次,维护n次堆。
空间复杂度:O(k),堆大小k。

方法二:快速选择(quickselect)
与快速选择方法几乎完全一样,快速选择选出第k个数时,前k个数就是最小的k个数,正好完成题目的要求。

class Solution {
public:
    int partition(vector<int> &a,int l, int r){
        swap(a[l],a[l+rand()%(r-l+1)]);
        int j=l,pivot=a[l];
        for(int i=l+1;i<=r;i++){
            if(a[i]<pivot){
                swap(a[i],a[++j]);
            }
        }
        swap(a[l],a[j]);
        return j;
    }
    
    vector<int> getLeastNumbers(vector<int>& arr, int k) {
        int len=arr.size();
        int left=0,right=len-1;
        int m=k-1;
        while(left<=right){
            int index=partition(arr,left,right);
            if(index==m)    
                return vector<int>(arr.begin(),arr.begin()+k);
            else if(index<m)
                left=index+1;
            else if(index>m)
                right=index-1;
        }
        return {};
    }
};

时间复杂度:同quickselect,期望为O(n), 算法导论9.2有证明。
最坏情况下的时间复杂度为 O(n^2)。情况最差时,每次的划分点都是最大值或最小值,一共需要划分 n−1次,而一次划分需要线性的时间复杂度。
空间复杂度:最坏情况下的空间复杂度为 O(n)。最坏情况下需要划分 n 次,即 select 函数递归调用最深 n−1 层,而每层由于需要 O(1) 的空间,所以一共需要 O(n)的空间复杂度。期望递归lgn次,空间复杂度为O(lgn),我也不知道为啥。

其他方法:如果n个数的分布比较均匀,可以用桶排序,O(n)即可完成排序。
详见另一题

你可能感兴趣的:(算法题)