本文着重在于讲解用 “堆实现优先级队列” 以及优先级队列的应用,在本文所举的例子中,可能使用优先级队列来解并不是最优解法,但是正如我所说的:本文着重在于讲解“堆实现优先级队列”
堆的主要应用有两个,一个是排序方法[堆排序],一个是数据结构 [优先级队列]。
我们会发现,人们总是把二叉堆画成一棵二叉树。其实二叉堆在逻辑上就是一种特殊的二叉树,只不过存储在数组里。
比如 arr
是一个字符数组,注意数组的第一个索引 0 空着不用:
为什么索引 0 空着不用?
为了方便计算父节点和子节点的索引,通常会将数组的第一个元素存储在索引1的位置上,而不是索引0。这样可以通过简单的数学计算得到父节点和子节点的索引,而无需进行额外的操作。
具体来说,在该代码中:
根据完全二叉树的性质,如果某个节点的索引为i,则其左子节点的索引为2i,右子节点的索引为2i + 1。
如果索引从1开始,则根节点的索引为1,其左子节点的索引为2,右子节点的索引为3。
如果索引从0开始,则根节点的索引为0,其左子节点的索引为1,右子节点的索引为2。
因此,为了避免对索引的调整和计算,通常会将数组的第一个元素放在索引1的位置上,并从索引1开始使用。这也是为什么在这段代码中索引0不被使用的原因。
请注意,这种索引方式只是约定俗成的一种做法,并非固定规定。在某些情况下,也可以使用索引从0开始的方式实现堆或优先队列。这取决于具体的实现和需求。
可以使用 最大堆/最小堆 来构建优先级队列,当插入或者删除元素的时候,元素会自动排序,这底层的原理就是二叉堆的操作。
当我们使用一个最大堆来实现一个优先级队列时,堆顶元素总是数组中的最大值。这背后就是由[上浮] 和 [下沉] 两个操作来维护堆结构的。
我们要讲的是最大堆,每个节点都比它的两个子节点大,但是在插入元素和删除元素时,难免破坏堆的性质,这就需要通过这两个操作来恢复堆的性质了。
对于最大堆,会破坏堆性质的有两种情况:
1、如果某个节点 A 比它的子节点(中的一个)小,那么 A 就不配做父节点,应该下去,下面那个更大的节点上来做父节点,这就是对 A 进行下沉。
2、如果某个节点 A 比它的父节点大,那么 A 不应该做子节点,应该把父节点换下来,自己去做父节点,这就是对 A 的上浮。
当然,错位的节点 A 可能要上浮(或下沉)很多次,才能到达正确的位置,恢复堆的性质。所以代码中肯定有一个 while
循环。
private void swim(int x) {
// 索引 1 是堆顶
//判断:x不是堆顶元素且x大于其父结点
while (x > 1 && less(parent(x), x)) {
// 交换x的父结点与x下标元素
swap(parent(x), x);
//将父节点的索引给x,指针指向x
x = parent(x);
}
}
private void sink(int x) {
// size 是堆的最后一个索引
//判断:当x的左节点不是堆底元素时
while (left(x) <= size) {
// 先假设左边节点较大
int max = left(x);
// 如果右边节点存在,比一下大小
//判断:右节点不是堆底元素且右节点值大于max的值
if (right(x) <= size && less(max, right(x)))
max = right(x);
// 结点 x 比俩孩子都大,就不必下沉了
if (less(max, x)) break;
// 否则,不符合最大堆的结构,下沉 x 结点
swap(x, max);
x = max;
}
}
将元素插到堆的底部,然后上浮到对应位置
public void insert(Key e) {
size++;
// 先把新元素加到最后
pq[size] = e;
// 然后让它上浮到正确的位置
swim(size);
}
将要删除的元素与堆底元素对调,然后删除堆底元素。最后维护堆结构
public Key delMax() {
// 最大堆的堆顶就是最大元素
Key max = pq[1];
// 把这个最大元素换到最后,删除之
swap(1, size);
pq[size] = null;
size--;
// 让 pq[1] 下沉到正确位置
sink(1);
return max;
}
查看最大值,直接返回堆顶元素即可
public Key max() {
return pq[1];
}
public class MaxPQ
> {
/*完全二叉树中的索引下标是可以计算出来的*/
// 父节点的索引
int parent(int root) {
return root / 2;
}
// 左孩子的索引
int left(int root) {
return root * 2;
}
// 右孩子的索引
int right(int root) {
return root * 2 + 1;
}
// 存储元素的数组
private Key[] pq;
// 当前 Priority Queue 中的元素个数
private int size = 0;
public MaxPQ(int cap) {
// 索引 0 不用,所以多分配一个空间
pq = (Key[]) new Comparable[cap + 1];
}
/* 返回当前队列中最大元素 */
public Key max() {
return pq[1];
}
/* 插入元素 e */
public void insert(Key e) {
size++;
// 先把新元素加到最后
pq[size] = e;
// 然后让它上浮到正确的位置
swim(size);
}
/* 删除并返回当前队列中最大元素 */
public Key delMax() {
// 最大堆的堆顶就是最大元素
Key max = pq[1];
// 把这个最大元素换到最后,删除之
swap(1, size);
pq[size] = null;
size--;
// 让 pq[1] 下沉到正确位置
sink(1);
return max;
}
/* 上浮第 x 个元素,以维护最大堆性质 */
private void swim(int x) {
// 如果浮到堆顶,就不能再上浮了
//因为是从索引1开始的,所以索引1是堆顶
//判断:当x不是堆顶且x的父结点小于x时
while (x > 1 && less(parent(x), x)) {
// 如果第 x 个元素比上层大
// 交换数组下标元素
swap(parent(x), x);
x = parent(x);
}
}
/* 下沉第 x 个元素,以维护最大堆性质 */
private void sink(int x) {
// 如果沉到堆底,就沉不下去了
while (left(x) <= size) {
// 先假设左边节点较大
int max = left(x);
// 如果右边节点存在,比一下大小
if (right(x) <= size && less(max, right(x)))
max = right(x);
// 结点 x 比俩孩子都大,就不必下沉了
if (less(max, x)) break;
// 否则,不符合最大堆的结构,下沉 x 结点
swap(x, max);
x = max;
}
}
/* 交换数组的两个元素 */
private void swap(int i, int j) {
Key temp = pq[i];
pq[i] = pq[j];
pq[j] = temp;
}
/* pq[i] 是否比 pq[j] 小? */
private boolean less(int i, int j) {
return pq[i].compareTo(pq[j]) < 0;
}
}
Comparable
通过实现Comparable接口,我们可以在堆和优先级队列中比较元素的大小,以维护它们的排序规则。
在这段代码中,Key作为泛型参数限制了存储在pq数组中的元素类型必须实现Comparable接口,以便能够进行比较操作(例如使用compareTo方法)。这样做可以确保我们能够正确地进行插入、删除和获取最大元素等操作,使得堆和优先级队列能够按照特定的顺序进行排序和处理。
在这段代码中,pq = (Key[]) new Comparable[cap + 1];是用来创建一个泛型数组的操作。
首先,我们需要了解在Java中创建泛型数组的限制。由于Java的类型擦除机制,无法直接创建一个具体类型的泛型数组。
因此,我们只能通过创建一个非泛型数组,然后将其转换为泛型数组。
在这段代码中,new Comparable[cap + 1]创建了一个长度为cap + 1的非泛型数组,
并且元素的类型是Comparable接口。这个数组在内存中被分配了空间。
然后,(Key[])表示进行了一个类型转换。
因为我们知道该数组是要存储Key类型的元素,所以我们将其强制转换为泛型数组类型Key[]。
最后,将转换后的泛型数组赋值给变量pq,使得pq引用这个泛型数组。
需要注意的是,在进行强制类型转换时,存在一定的风险。
如果实际存储在数组中的元素类型不符合泛型参数Key的约束条件,可能会导致运行时错误。
因此,在使用该代码时,应确保泛型参数和实际存储的元素类型是匹配的。*/
使用数组构造一个最大堆,然后选出第k大的元素
// 构建最大堆
public void buildMaxHeap(int[] a, int heapSize) {
for (int i = heapSize / 2; i >= 0; --i) {
maxHeapify(a, i, heapSize); // 对每个非叶子节点进行调整,使其满足最大堆的性质
}
}
// 调整以i为根节点的子树,使其满足最大堆的性质
public void maxHeapify(int[] a, int i, int heapSize) {
//计算左右节点的下标
int left = i * 2 + 1, right = i * 2 + 2, largest = i;
// 下沉操作:比较节点i与其左右子节点的值,找到最大值
// 先与左节点对比
if (left < heapSize && a[left] > a[largest]) {
largest = left;
}
// 再与右节点对比
if (right < heapSize && a[right] > a[largest]) {
largest = right;
}
if (largest != i) {
swap(a, i, largest); // 将节点i与最大值节点交换位置
maxHeapify(a, largest, heapSize); // 继续向下调整以保持最大堆的性质
}
}
// 交换数组中两个元素的位置
public void swap(int[] a, int i, int j) {
int temp = a[i];
a[i] = a[j];
a[j] = temp;
}
在构建最大堆时,我们只需要对非叶子节点进行调整,而不需要对叶子节点进行调整。这是因为堆的性质决定了,一个完全二叉树的叶子节点已经满足最大堆的条件,即叶子节点的值不会比其父节点更大。
考虑到完全二叉树的特点,具有n/2
个节点是非叶子节点,其中n
是堆中元素的总数。比如下标为i的元素,其左节点为 2i,右节点为 2i+1,所以对n个节点来说,只能有n/2
个节点是非叶子节点。
所以,我们可以从最后一个非叶子节点(索引为n/2 - 1
)开始,向前逐个调用maxHeapify
方法,将每个节点及其子树调整为最大堆。
由于最大堆的性质要求父节点的值大于或等于其子节点的值,通过逐层向上调整非叶子节点,我们能够确保整个堆都满足最大堆的要求。
因此,在buildMaxHeap
方法中,我们只对非叶子节点进行调整,以节省时间
选出第k大的元素的方法是取出堆顶的元素,将其与堆底元素交换,然后缩小堆,重新维护堆结构。就相当于把堆顶的最大元素删除了。
正数第k个元素就是倒数的第 length - k + 1个元素,所以我们将后面length - k + 1个元素与堆顶元素交换即可
public int findKthLargest(int[] nums, int k) {
int heapSize = nums.length;
buildMaxHeap(nums, heapSize); // 构建最大堆
for (int i = nums.length - 1; i >= nums.length - k + 1; --i) {
swap(nums, 0, i); // 将堆顶元素与当前未排序部分的最后一个元素交换
--heapSize; // 缩小堆的大小
maxHeapify(nums, 0, heapSize); // 调整堆使其继续满足最大堆的性质
}
return nums[0]; // 返回第k个最大元素(堆顶元素)
}
class Solution {
public int findKthLargest(int[] nums, int k) {
int heapSize = nums.length;
buildMaxHeap(nums, heapSize); // 构建最大堆
for (int i = nums.length - 1; i >= nums.length - k + 1; --i) {
swap(nums, 0, i); // 将堆顶元素与当前未排序部分的最后一个元素交换
--heapSize; // 缩小堆的大小
maxHeapify(nums, 0, heapSize); // 调整堆使其继续满足最大堆的性质
}
return nums[0]; // 返回第k个最大元素(堆顶元素)
}
// 构建最大堆
public void buildMaxHeap(int[] a, int heapSize) {
for (int i = heapSize / 2; i >= 0; --i) {
maxHeapify(a, i, heapSize); // 对每个非叶子节点进行调整,使其满足最大堆的性质
}
}
// 调整以i为根节点的子树,使其满足最大堆的性质
public void maxHeapify(int[] a, int i, int heapSize) {
//计算左右节点的下标
int left = i * 2 + 1, right = i * 2 + 2, largest = i;
// 下沉操作:比较节点i与其左右子节点的值,找到最大值
// 先与左节点对比
if (left < heapSize && a[left] > a[largest]) {
largest = left;
}
// 再与右节点对比
if (right < heapSize && a[right] > a[largest]) {
largest = right;
}
if (largest != i) {
swap(a, i, largest); // 将节点i与最大值节点交换位置
maxHeapify(a, largest, heapSize); // 继续向下调整以保持最大堆的性质
}
}
// 交换数组中两个元素的位置
public void swap(int[] a, int i, int j) {
int temp = a[i];
a[i] = a[j];
a[j] = temp;
}
}
使用哈希表记录每个元素与其出现次数的映射关系
构建一个大小为k的小根堆,如果不足k个元素就直接将当前数字加入到堆中
否则判断堆中的最小值是否小于当前数字的出现次数,如果堆中的最小值小于当前数字出现次数,说明目前的堆顶元素不在前k个高频元素中,将其弹出并将当前数字加入到堆中
import java.util.*;
class Solution {
public int[] topKFrequent(int[] nums, int k) {
// 统计每个数字出现的次数
Map counter = new HashMap<>();
for (int num : nums) {
counter.put(num, counter.getOrDefault(num, 0) + 1);
}
// 定义小根堆,根据数字频率自小到大排序
Queue pq = new PriorityQueue<>(
(v1, v2) -> counter.get(v1) - counter.get(v2));
// 遍历数组,维护一个大小为 k 的小根堆:
// 不足 k 个直接将当前数字加入到堆中;否则判断堆中的最小次数是否小于当前数字的出现次数,
// 若是,则删掉堆中出现次数最少的一个数字,将当前数字加入堆中。
for (int num : counter.keySet()) {
if (pq.size() < k) {
pq.offer(num);
} else if (counter.get(pq.peek()) < counter.get(num)) {
pq.poll();
pq.offer(num);
}
}
// 构造返回结果
int[] res = new int[k];
int idx = 0;
for (int num : pq) {
res[idx++] = num;
}
return res;
}
}