leetcode *347. 前 K 个高频元素(堆排序)

【题目】*347. 前 K 个高频元素

剑指 Offer 40. 最小的k个数
*215. 数组中的第K个最大元素
*347. 前 K 个高频元素

给定一个非空的整数数组,返回其中出现频率前 k 高的元素。

示例 1:

输入: nums = [1,1,1,2,2,3], k = 2
输出: [1,2]

示例 2:

输入: nums = [1], k = 1
输出: [1]

提示:

你可以假设给定的 k 总是合理的,且 1 ≤ k ≤ 数组中不相同的元素的个数。
你的算法的时间复杂度必须优于 O(n log n) , n 是数组的大小。
题目数据保证答案唯一,换句话说,数组中前 k 个高频元素的集合是唯一的。
你可以按任意顺序返回答案。

【解题思路1】map、小顶堆

用map记录各个元素出现的次数,然后排序后得到频率最高的k个数

class Solution {
     
    public int[] topKFrequent(int[] nums, int k) {
     
        Map<Integer, Integer> map = new HashMap<>();
        for(int temp : nums) {
     
            map.put(temp, map.getOrDefault(temp, 0) + 1);
        }
        int len = map.size();
        int[][] order = new int[len][2];
        int index = 0;
        for(int temp : map.keySet()) {
     
            order[index][0] = temp;
            order[index][1] = map.get(temp);
            index++;
        }
        Arrays.sort(order, (a, b) -> b[1] - a[1]);
        int[] ans = new int[k];
        for(int i = 0; i < k; i++) {
     
            ans[i] = order[i][0];
        }
        return ans;
    }
}

最简单的做法是给「出现次数数组」排序。但由于可能有 O(N) 个不同的出现次数,故总的算法复杂度会达到 O(NlogN),不满足题目的要求。
可以利用堆的思想改进:维护一个大小为k的小顶堆,然后遍历「出现次数数组」

  • 如果堆的元素个数小于 k,就可以直接插入堆中。
  • 如果堆的元素个数等于 k,则检查堆顶与当前出现次数的大小。如果堆顶更大,说明至少有 k 个数字的出现次数比当前值大,故舍弃当前值;否则,就弹出堆顶,并将当前值插入堆中。

遍历完成后,堆中的元素就代表了「出现次数数组」中前 k 大的值。
下面是使用优先队列这个现成的类型实现的,也可以手动实现小顶堆

class Solution {
     
    public int[] topKFrequent(int[] nums, int k) {
     
        Map<Integer, Integer> occurrences = new HashMap<Integer, Integer>();
        for (int num : nums) {
     
            occurrences.put(num, occurrences.getOrDefault(num, 0) + 1);
        }

        // int[] 的第一个元素代表数组的值,第二个元素代表了该值出现的次数
        PriorityQueue<int[]> queue = new PriorityQueue<int[]>(new Comparator<int[]>() {
     
            public int compare(int[] m, int[] n) {
     
                return m[1] - n[1];
            }
        });
        for (Map.Entry<Integer, Integer> entry : occurrences.entrySet()) {
     
            int num = entry.getKey(), count = entry.getValue();
            if (queue.size() == k) {
     
                if (queue.peek()[1] < count) {
     
                    queue.poll();
                    queue.offer(new int[]{
     num, count});
                }
            } else {
     
                queue.offer(new int[]{
     num, count});
            }
        }
        int[] ret = new int[k];
        for (int i = 0; i < k; ++i) {
     
            ret[i] = queue.poll()[0];
        }
        return ret;
    }
}
class Solution {
     
    public int[] topKFrequent(int[] nums, int k) {
     
        Map<Integer, Integer> map = new HashMap<>();
        for (int n : nums){
     
            map.put(n, map.getOrDefault(n, 0) + 1);
        }
        PriorityQueue<Map.Entry<Integer, Integer>> queue = new PriorityQueue<>((e1, e2) -> e2.getValue() - e1.getValue());
        queue.addAll(map.entrySet());
        int[] ans = new int[k];
        for (int i = 0; i < k && !queue.isEmpty(); ++i){
     
            ans[i] = queue.poll().getKey();
        }
        return ans;
    }
}

手动建堆

class Solution {
     
    //记录数组中元素及其对应出现的次数
    Map<Integer , Integer> map = new HashMap<>();
    
    public int[] topKFrequent(int[] nums, int k) {
         
        int[] heap = new int[k];
        for(int i : nums){
     
            map.put(i , map.getOrDefault(i,0) + 1);
        }
        Iterator it = map.keySet().iterator();
        int i = 0;
        while(it.hasNext()){
     
            // 先初始化一个大小为k的堆,当堆中元素个数为k时,建立小根堆
            if( i < k){
     
                heap[i] = (Integer)it.next();
                i++;
                if(i == k){
     
                    for(int j = k/2 -1 ; j >= 0 ; j--){
     
                        heapSort(heap,j);
                    }
                }
            }else{
        //小根堆建好后 ,对于每个新遍历的元素与堆顶比较,如果比堆顶大,替换堆顶,重新维持小根堆
                int key = (Integer)it.next(); 
                if(map.get(key) > map.get(heap[0])) heap[0] = key;
                heapSort(heap , 0);
            }
            
        }
        return heap;
    }
    
    //维持小根堆
    //注意,堆中元素比较是比较它们出现的次数,即该元素在map中对应的value
    public void heapSort(int[] heap , int i){
     
        int temp = heap[i];
        for(int j = 2*i + 1 ; j < heap.length ; j = 2*j + 1){
     
            if(j+1 < heap.length && map.get(heap[j+1]) < map.get(heap[j])) j++;
            if(map.get(heap[j]) < map.get(temp)){
     
                heap[i] = heap[j];
                i = j;
            }else break;
        }
        heap[i] = temp;
    }
}

【解题思路2】快排(待研究)

在对数组 arr[l…r] 做快速排序的过程中,首先将数组划分为两个部分arr[i…q−1] 与 arr[q+1…j],并使得 arr[i…q−1] 中的每一个值都不超过 arr[q],且 arr[q+1…j] 中的每一个值都大于 arr[q]。
根据 k 与左侧子数组 arr[i…q−1] 的长度(为 q−i)的大小关系:

  • 如果 k≤q−i,则数组 arr[l…r] 前 k 大的值,就等于子数组 arr[i…q−1] 前 k 大的值。
  • 否则,数组 arr[l…r] 前 k 大的值,就等于左侧子数组全部元素,加上右侧子数组 arr[q+1…j] 中前 k−(q−i) 大的值。
class Solution {
     
    public int[] topKFrequent(int[] nums, int k) {
     
        Map<Integer, Integer> occurrences = new HashMap<Integer, Integer>();
        for (int num : nums) {
     
            occurrences.put(num, occurrences.getOrDefault(num, 0) + 1);
        }

        List<int[]> values = new ArrayList<int[]>();
        for (Map.Entry<Integer, Integer> entry : occurrences.entrySet()) {
     
            int num = entry.getKey(), count = entry.getValue();
            values.add(new int[]{
     num, count});
        }
        int[] ret = new int[k];
        qsort(values, 0, values.size() - 1, ret, 0, k);
        return ret;
    }

    public void qsort(List<int[]> values, int start, int end, int[] ret, int retIndex, int k) {
     
        int picked = (int) (Math.random() * (end - start + 1)) + start;
        Collections.swap(values, picked, start);
        
        int pivot = values.get(start)[1];
        int index = start;
        for (int i = start + 1; i <= end; i++) {
     
            if (values.get(i)[1] >= pivot) {
     
                Collections.swap(values, index + 1, i);
                index++;
            }
        }
        Collections.swap(values, start, index);

        if (k <= index - start) {
     
            qsort(values, start, index - 1, ret, retIndex, k);
        } else {
     
            for (int i = start; i <= index; i++) {
     
                ret[retIndex++] = values.get(i)[0];
            }
            if (k > index - start + 1) {
     
                qsort(values, index + 1, end, ret, retIndex, k - (index - start + 1));
            }
        }
    }
}

你可能感兴趣的:(Leetcode,#,堆,#,最小/最大的第k个数,leetcode,堆)