堆分为两种:大堆和小堆。它们之间的区别在于元素在堆中的排列顺序和访问方式。
以下是一个示例图示,展示了一个包含7个元素的大堆和小堆的结构:
大堆:
90
/ \
75 30
/ \ / \
20 15 10 7
小堆:
7
/ \
10 30
/ \ / \
20 15 75 90
这些图示说明了大堆和小堆的不同排列顺序。在大堆中,父节点的值大于子节点的值,而在小堆中,父节点的值小于子节点的值。
注意:堆总是一颗完全二叉树
从堆的概念可知,堆是一棵完全二叉树,因此可以层序的规则采用顺序的方式来高效存储,
注意:对于非完全二叉树,则不适合使用顺序方式进行存储,因为为了能够还原二叉树,空间中必须要存储空节点,就会导致空间利用率比较低。
将元素存储到数组中后,可以根据二叉树章节的性质5对树进行还原。假设i为节点在数组中的下标,则有:
对于集合{ 27,15,19,18,28,34,65,49,25,37 }中的数据,如果将其创建成小堆呢?
仔细观察上图后发现:根节点的左右子树已经完全满足堆的性质,因此只需将根节点向下调整好即可。
下面是代码实现:
// shiftDown方法用来实现下沉操作
// array参数是待构建小堆的数组
// parent参数是当前需要下沉的节点的索引
public void shiftDown(int[] array, int parent) {
int length = array.length;
int child = 2 * parent + 1; // 左子节点索引
while (child < length) {
// 找到左右孩子中较小的孩子
if (child + 1 < length && array[child] > array[child + 1]) {
child++; // 如果右子节点存在并且小于左子节点的值,则将child指向右子节点
}
// 如果当前节点小于或等于左右子节点中较小的节点,说明已经符合小堆要求
if (array[parent] <= array[child]) {
break;
}
// 否则,交换当前节点和较小子节点的值,接着需要继续向下调整
int temp = array[parent];
array[parent] = array[child];
array[child] = temp;
parent = child;
child = 2 * parent + 1;
}
}
这段代码实现了堆排序中的下沉操作(也称为向下调整或堆化)。下沉操作用于维护小堆的性质,确保父节点永远小于或等于其子节点。
时间复杂度分析:
最坏的情况即图示的情况,从根一路比较到叶子,比较的次数为完全二叉树的高度,即时间复杂度为O(log n)
那对于普通的序列{ 1,5,3,8,7,6 },即根节点的左右子树不满足堆的特性,又该如何调整呢?
public static void createHeap(int[] array) {
// 找倒数第一个非叶子节点,从该节点位置开始往前一直到根节点,遇到一个节点,应用向下调整
int root = ((array.length-2)>>1);
for (; root >= 0; root--) {
shiftDown(array, root);
}
}
因为堆是完全二叉树,而满二叉树也是完全二叉树,此处为了简化使用满二叉树来证明(时间复杂度本来看的就是近似值,多几个节点不影响最终结果):
堆的插入总共需要两个步骤:
public void shiftUp(int child) {
// 找到child的双亲
int parent = (child - 1) / 2;
while (child > 0) {
// 如果双亲比孩子大,parent满足堆的性质,调整结束
if (array[parent] > array[child]) {
break;
}
else{
// 将双亲与孩子节点进行交换
int t = array[parent];
array[parent] = array[child];
array[child] = t;
// 小的元素向下移动,可能到值子树不满足对的性质,因此需要继续向上调增
child = parent;
parent = (child - 1) / 1;
}
}
}
注意:堆的删除一定删除的是堆顶元素。具体如下:
public void deleteTop() {
// 将堆顶元素与堆中最后一个元素交换
array[0] = array[size - 1];
// 堆中有效数据个数减少一个
size--;
// 对堆顶元素进行向下调整
int parent = 0; // 当前节点的索引
// 持续向下调整,直到满足堆的性质
while (true) {
// 左孩子节点的索引
int leftChild = parent * 2 + 1;
// 右孩子节点的索引
int rightChild = leftChild + 1;
// 父节点与左右孩子节点中值最大的节点进行交换
int maxChild = parent; // 最大值节点的索引
// 如果左孩子存在且大于父节点,则更新最大值节点
if (leftChild < size && array[leftChild] > array[maxChild]) {
maxChild = leftChild;
}
// 如果右孩子存在且大于当前最大值节点,则更新最大值节点
if (rightChild < size && array[rightChild] > array[maxChild]) {
maxChild = rightChild;
}
// 如果最大值节点是当前节点本身,则调整结束
if (maxChild == parent) {
break;
} else {
// 交换最大节点与父节点
int temp = array[parent];
array[parent] = array[maxChild];
array[maxChild] = temp;
// 更新当前节点为最大值节点
parent = maxChild;
}
}
}
前面介绍过队列,队列是一种先进先出(FIFO)的数据结构,但有些情况下,操作的数据可能带有优先级,一般出队列时,可能需要优先级高的元素先出队列,该中场景下,使用队列显然不合适,比如:在手机上玩游戏的时候,如果有来电,那么系统应该优先处理打进来的电话;初中那会班主任排座位时可能会让成绩好的同学先挑座位。
在这种情况下,数据结构应该提供两个最基本的操作,一个是返回最高优先级对象,一个是添加新的对象。这种数据结构就是优先级队列(Priority Queue)。
Java集合框架中提供了PriorityQueue和PriorityBlockingQueue两种类型的优先级队列,PriorityQueue是线程不安全的,PriorityBlockingQueue是线程安全的,本文主要介绍PriorityQueue。
关于PriorityQueue的使用要注意:
PriorityQueue中常见的构造方法:
构造器 | 功能介绍 |
---|---|
PriorityQueue() | 创建一个空的优先级队列,默认容量是11 |
PriorityQueue(int initialCapacity) | 创建一个初始容量为initialCapacity的优先级队列,注意: initialCapacity不能小于1,否则会抛IllegalArgumentException异 常 |
PriorityQueue(Collection extends E> c) | 用一个集合来创建优先级队列 |
下面是使用示例:
static void TestPriorityQueue(){
// 创建一个空的优先级队列,底层默认容量是11
PriorityQueue<Integer> q1 = new PriorityQueue<>();
// 创建一个空的优先级队列,底层的容量为initialCapacity
PriorityQueue<Integer> q2 = new PriorityQueue<>(100);
ArrayList<Integer> list = new ArrayList<>();
list.add(4);
list.add(3);
list.add(2);
list.add(1);
// 用ArrayList对象来构造一个优先级队列的对象
// q3中已经包含了三个元素
PriorityQueue<Integer> q3 = new PriorityQueue<>(list);
System.out.println(q3.size());
System.out.println(q3.peek());
}
注意:默认情况下,PriorityQueue队列是小堆,如果需要大堆需要用户提供比较器
// 用户自己定义的比较器:直接实现Comparator接口,然后重写该接口中的compare方法即可
class IntCmp implements Comparator<Integer>{
@Override
public int compare(Integer o1, Integer o2) {
return o2-o1;
}
}
public class TestPriorityQueue {
public static void main(String[] args) {
PriorityQueue<Integer> p = new PriorityQueue<>(new IntCmp());
p.offer(4);
p.offer(3);
p.offer(2);
p.offer(1);
p.offer(5);
System.out.println(p.peek());
}
}
下面是 PriorityQueue中常用的方法:
函数名 | 功能介绍 |
---|---|
booleanoffer(E e) | 插入元素e,插入成功返回true,如果e对象为空,抛出NullPointerException异常,时间复杂度 ,注意:空间不够时候会进行扩容 |
E peek() | 获取优先级最高的元素,如果优先级队列为空,返回null |
E poll() | 移除优先级最高的元素并返回,如果优先级队列为空,返回null |
int size() | 获取有效元素的个数 |
void clear() | 清空 |
boolean isEmpty() | 检测优先级队列是否为空,空返回true |
下面是这些方法的使用示例:
import java.util.PriorityQueue;
public class Main {
public static void main(String[] args) {
PriorityQueue<Integer> heap = new PriorityQueue<>();
// 测试插入元素
heap.offer(10); // 返回 true
heap.offer(5); // 返回 true
heap.offer(15); // 返回 true
heap.offer(2); // 返回 true
// 测试获取优先级最高的元素
// 结果为 2
System.out.println(heap.peek());
// 测试移除优先级最高的元素
// 结果为 2
System.out.println(heap.poll());
// 测试获取有效元素的个数
// 结果为 3
System.out.println(heap.size());
// 测试清空优先级队列
heap.clear();
// 测试检测优先级队列是否为空
// 结果为 true
System.out.println(heap.isEmpty());
}
}
以下是JDK 1.8中,PriorityQueue的扩容方式:
优先级队列的扩容说明:
MAX_ARRAY_SIZE等于Integer.MAX_VALUE - 8,Integer.MAX_VALUE - 8。等于 2,147,483,639。
我们通过堆可以模拟实现优先级队列,因为堆具有以下特性:
优先性在优先级队列中体现在以下方面:
通过以上方式,可以使用堆来实现优先级队列,确保具有更高优先级的元素优先被处理或删除。
下面我们基于堆来模拟实现一个优先级队列:
public class MyPriorityQueue {
// 演示作用,不再考虑扩容部分的代码
private int[] array = new int[100]; // 使用数组来存储元素
private int size = 0; // 当前队列的大小
// 向优先队列中插入元素
public void offer(int e) {
array[size++] = e; // 将元素插入数组末尾
shiftUp(size - 1); // 对插入的元素进行上浮操作,以保持堆的性质
}
// 弹出并返回优先队列中最高优先级的元素
public int poll() {
int oldValue = array[0]; // 保存堆顶元素的值
array[0] = array[--size]; // 将堆尾元素移到堆顶
shiftDown(0); // 对堆顶元素进行下沉操作,以保持堆的性质
return oldValue; // 返回弹出的元素值
}
// 返回优先队列中最高优先级的元素
public int peek() {
return array[0]; // 直接返回堆顶元素的值
}
}
请注意,此处的代码仅展示了演示目的,没有考虑扩容部分的代码实现。
用堆作为底层结构封装优先级队列,这点我们已经讲过,在此不过多赘述
堆排序即利用堆的思想来进行排序,总共分为两个步骤:
建堆和堆删除中都用到了向下调整,因此掌握了向下调整,就可以完成堆排序。
TOP-K问题:即求数据集合中前K个最大的元素或者最小的元素,一般情况下数据量都比较大。
比如:专业前10名、世界500强、富豪榜、游戏中前100的活跃玩家等。
我们可以通过使用堆来解决TOP-K问题,具体步骤如下:
一: 创建一个大小为K的最小堆(或最大堆,取决于你是求前K个最小值还是最大值)。
二:遍历数据集合,对于每个元素执行以下操作:
三: 遍历完数据集合后,堆中的元素即为前K个最小(或最大)的元素。
下面是一个使用Java实现堆解决TOP-K问题的示例代码:
import java.util.PriorityQueue;
public class TopK {
public static void main(String[] args) {
int[] nums = {9, 3, 7, 5, 1, 8, 2, 6, 4};
int k = 4;
findTopK(nums, k);
}
private static void findTopK(int[] nums, int k) {
PriorityQueue<Integer> minHeap = new PriorityQueue<>();
for (int num : nums) {
if (minHeap.size() < k) {
minHeap.offer(num);
} else if (num > minHeap.peek()) {
minHeap.poll();
minHeap.offer(num);
}
}
System.out.println("Top " + k + " elements:");
while (!minHeap.isEmpty()) {
System.out.print(minHeap.poll() + " ");
}
}
}
以上示例中,对数组nums
求前4个最小元素,使用了PriorityQueue
实现了一个小顶堆。遍历数组时,根据堆的大小和当前元素与堆顶元素的比较进行插入和调整。最后,打印出堆中的元素即为前4个最小的元素。
优先级队列在插入元素时有个要求:插入的元素不能是null或者元素之间必须要能够进行比较,为了简单起见,我们只是插入了Integer类型,那优先级队列中能否插入自定义类型对象呢?
class Card {
public int rank; // 数值
public String suit; // 花色
public Card(int rank, String suit) {
this.rank = rank;
this.suit = suit;
}
}
public class TestPriorityQueue {
public static void TestPriorityQueue()
{
PriorityQueue<Card> p = new PriorityQueue<>();
p.offer(new Card(1, "♠"));
p.offer(new Card(2, "♠"));
}
public static void main(String[] args) {
TestPriorityQueue();
}
}
优先级队列底层使用堆,而向堆中插入元素时,为了满足堆的性质,必须要进行元素的比较,而此时Card是没有办法直接进行比较的,因此抛出异常。
在Java中,基本类型的对象可以直接比较大小。
public class TestCompare {
public static void main(String[] args) {
int a = 10;
int b = 20;
System.out.println(a > b);
System.out.println(a < b);
System.out.println(a == b);
char c1 = 'A';
char c2 = 'B';
System.out.println(c1 > c2);
System.out.println(c1 < c2);
System.out.println(c1 == c2);
boolean b1 = true;
boolean b2 = false;
System.out.println(b1 == b2);
System.out.println(b1 != b2);
}
}
class Card {
public int rank; // 数值
public String suit; // 花色
public Card(int rank, String suit) {
this.rank = rank;
this.suit = suit;
}
}
public class TestPriorityQueue {
public static void main(String[] args) {
Card c1 = new Card(1, "♠");
Card c2 = new Card(2, "♠");
Card c3 = c1;
//System.out.println(c1 > c2); // 编译报错
System.out.println(c1 == c2); // 编译成功 ----> 打印false,因为c1和c2指向的是不同对象
//System.out.println(c1 < c2); // 编译报错
System.out.println(c1 == c3); // 编译成功 ----> 打印true,因为c1和c3指向的是同一个对象
}
}
c1、c2和c3分别是Card类型的引用变量,上述代码在比较编译时:
从编译结果可以看出,Java中引用类型的变量不能直接按照 > 或者 < 方式进行比较。 那为什么== 可以比较?
因为:对于用户实现自定义类型,都默认继承自Object类,而Object类中提供了equal方法,而==默认情况下调用的就是equal方法,但是该方法的比较规则是:没有比较引用变量引用对象的内容,而是直接比较引用变量的地址,但有些情况下该种比较就不符合题意。
// Object中equal的实现,可以看到:直接比较的是两个引用变量的地址
public boolean equals(Object obj) {
return (this == obj);
}
有些情况下,需要比较的是对象中的内容,比如:向优先级队列中插入某个对象时,需要对按照对象中内容来调整堆,那该如何处理呢?答案是重写覆盖基类的equals
public class Card {
public int rank; // 数值
public String suit; // 花色
public Card(int rank, String suit) {
this.rank = rank;
this.suit = suit;
}
@Override
public boolean equals(Object o) {
// 自己和自己比较
if (this == o) {
return true;
}
// o如果是null对象,或者o不是Card的子类
if (o == null || !(o instanceof Card)) {
return false;
}
// 注意基本类型可以直接比较,但引用类型最好调用其equal方法
Card c = (Card)o;
return rank == c.rank
&& suit.equals(c.suit);
}
}
注意: 一般覆写 equals 的套路就是上面演示的
覆写基类equal的方式虽然可以比较,但缺陷是:equal只能按照相等进行比较,不能按照大于、小于的方式进行比较。
Comparble是JDK提供的泛型的比较接口类,源码实现具体如下:
public interface Comparable<E> {
// 返回值:
// < 0: 表示 this 指向的对象小于 o 指向的对象
// == 0: 表示 this 指向的对象等于 o 指向的对象
// > 0: 表示 this 指向的对象大于 o 指向的对象
int compareTo(E o);
}
对用用户自定义类型,如果要想按照大小与方式进行比较时:在定义类时,实现Comparble接口即可,然后在类中重写compareTo方法。
Java中的Comparable
接口是用于实现对象的自然排序的接口。它包含一个compareTo
方法,用于比较两个对象的顺序。
compareTo
方法有以下三种返回值:
下面是一个简单的例子,演示如何使用Comparable
接口来自然排序自定义的Person
类:
import java.util.ArrayList;
import java.util.Collections;
class Person implements Comparable<Person> {
private String name;
private int age;
public Person(String name, int age) {
this.name = name;
this.age = age;
}
// 实现compareTo方法
@Override
public int compareTo(Person other) {
return this.age - other.age; // 按照年龄排序
}
// 其他getter和setter方法
@Override
public String toString() {
return "Person{" +
"name='" + name + '\'' +
", age=" + age +
'}';
}
}
public class Main {
public static void main(String[] args) {
ArrayList<Person> people = new ArrayList<>();
people.add(new Person("Alice", 25));
people.add(new Person("Bob", 20));
people.add(new Person("Charlie", 30));
System.out.println("排序前:");
for (Person person : people) {
System.out.println(person);
}
Collections.sort(people); // 使用Collections.sort()方法进行排序时,会自动调用compareTo()方法进行比较
System.out.println("排序后:");
for (Person person : people) {
System.out.println(person);
}
}
}
输出结果:
排序前:
Person{name='Alice', age=25}
Person{name='Bob', age=20}
Person{name='Charlie', age=30}
排序后:
Person{name='Bob', age=20}
Person{name='Alice', age=25}
Person{name='Charlie', age=30}
在上面的代码中,我们定义了一个Person
类,并实现了Comparable
接口。我们通过compareTo
方法比较了两个Person
对象的年龄,并在Main
类中使用Collections.sort
方法对people
列表进行了排序。排序后,列表中的Person
对象按照年龄的升序排列。
注意:Compareble是java.lang中的接口类,可以直接使用。
在Java中,如果我们想要比较两个对象,并根据它们的属性值进行排序或判断它们的相对顺序,我们可以使用比较器(Comparator)进行操作。
比较器是一个用于定义对象之间比较行为的接口。它包含了一个用于比较两个对象的方法 - compare()。该方法接受两个参数,分别是要比较的两个对象,然后返回一个整数值来表示它们的相对顺序。
下面是一个简单的示例,展示如何使用比较器比较两个Person对象:
import java.util.*;
// 定义Person类
class Person {
private String name;
private int age;
public Person(String name, int age) {
this.name = name;
this.age = age;
}
// 省略其他属性和方法
public String getName() {
return name;
}
public int getAge() {
return age;
}
}
// 定义比较器类
class AgeComparator implements Comparator<Person> {
@Override
public int compare(Person person1, Person person2) {
if (person1.getAge() < person2.getAge()) {
return -1; // person1在前
} else if (person1.getAge() > person2.getAge()) {
return 1; // person2在前
} else {
return 0; // 保持顺序不变
}
}
}
public class Main {
public static void main(String[] args) {
// 创建Person对象
Person person1 = new Person("Alice", 25);
Person person2 = new Person("Bob", 30);
Person person3 = new Person("John", 20);
// 创建比较器对象
AgeComparator comparator = new AgeComparator();
// 使用比较器比较对象
int result1 = comparator.compare(person1, person2); // 返回-1,person1在前
int result2 = comparator.compare(person2, person1); // 返回1,person2在前
int result3 = comparator.compare(person1, person3); // 返回0,保持顺序不变
System.out.println(result1);//-1
System.out.println(result2);//1
System.out.println(result3);//0
}
}
在上述代码中,我们定义了一个Person类,其中包含了姓名(name)和年龄(age)属性。然后,我们创建了一个比较器类AgeComparator,实现了Comparator接口,并重写了compare()方法来根据年龄来判断相对顺序。
在main()方法中,我们创建了三个Person对象,并使用AgeComparator比较器对象来比较它们的年龄。最后,我们打印了比较的结果,验证了对象之间的比较行为。
这就是基于比较器比较两个对象的示例。通过实现Comparator接口并重写compare()方法,我们可以定制化对象之间的比较行为,从而实现根据特定属性进行排序或判断相对顺序。
注意:Comparator是java.util 包中的泛型接口类,使用时必须导入对应的包。
我们要注意区分Comparable和Comparato:
三种比较方式对比:
覆写的方法 | 说明 |
---|---|
Object.equals | 因为所有类都是继承自 Object 的,所以直接覆写即可,不过只能比较相等与否 |
Comparable.compareTo | 需要手动实现接口,侵入性比较强,但一旦实现,每次用该类都有顺序,属于内部顺序,Compareble是java.lang中的接口类,可以直接使用。 |
Comparator.compare | 需要实现一个比较器对象,对待比较类的侵入性弱,但对算法代码实现侵入性强 ,Comparator是java.util 包中的泛型接口类,使用时必须导入对应的包。 |