目录
一、树概念及结构
二、二叉树树概念及结构
特殊的二叉树
三、堆的概念及结构
四、堆的创建
1、声明结构体
2、初始化
3、销毁
4、添加新元素
5、交换元素
6、向上调整
7、判断堆是否为空
8、移除堆顶元素
9、向下调整
10、获取堆元素个数
五、使用堆排序-排降序
向上调整建堆
向下调整建堆
建堆方式对比
小结:
完整版:
Heap.h声明部分
Heap.c函数部分
text.c使用及测试部分
树是一种非线性的数据结构,它是由n(n>=0)个有限结点组成一个具有层次关系的集合。把它叫做树是因 为它看起来像一棵倒挂的树,也就是说它是根朝上,而叶朝下的。
二叉树是一个由n(n>=0)个结点构成的有限集合,其中该集合可以为空,这时称其为空二叉树;或者由一个根结点以及两个互不相交的左子树和右子树组成,且左右子树均为二叉树。在二叉树中,子树被明确区分为左子树和右子树,且它们的顺序不可颠倒。
- 值得注意的是,二叉树的定义具有递归性质,因为二叉树本身可以为空,根结点可以有空的左子树或空的右子树。
- 这使得二叉树与普通树有明显的区别,即使只有一棵子树存在,也需要明确指定它是左子树还是右子树。这是二叉树与树最主要的区别之一。
- 请注意,二叉树不同于一般的树,因为它的子树具有左右之分,并且顺序不能颠倒。因此,“二叉树是结点度为2的树”的说法是不正确的。
当涉及到二叉树的特殊类型时,有两个主要概念需要了解:满二叉树和完全二叉树。
- 满二叉树:满二叉树是一种特殊的二叉树,其特点是每个层级的结点数都达到最大值。具体来说,如果一个二叉树的深度为K,且结点总数为2^K - 1,那么它就是一个满二叉树。满二叉树的每一层都包含最大数量的结点,使得它具有很特殊的结构。
- 完全二叉树:完全二叉树是一种高效的数据结构,与满二叉树相关。一个二叉树如果在深度为K的情况下,其结点都与深度为K的满二叉树中的编号从1到n的结点一一对应,那么它就被称为完全二叉树。需要注意的是,满二叉树是完全二叉树的一个特殊情况。
堆(Heap)是一种特殊的树状数据结构,通常用于实现优先队列和对数据进行排序。堆的主要特点是它是一棵树,其中每个节点的值满足特定的堆属性。在堆中,通常有两种主要类型:最大堆和最小堆。
堆的常见用途包括:
优先队列:堆可以用来实现高效的优先队列,使得可以快速访问和删除具有最高或最低优先级的元素。
堆排序:堆排序是一种高效的排序算法,它利用堆的性质来进行排序。它的时间复杂度为O(n log n)。
堆通常是以数组的形式来表示,其中父节点和子节点之间的关系通过数组索引来建立。具体来说,对于一个具有n个元素的堆,节点的索引从1到n编号,其中:
- 父节点的索引为i,则它的左子节点的索引为2i,右子节点的索引为2i + 1。
- 子节点的索引为i,则其父节点的索引为i/2。
这种数组表示方法使得堆的操作更加高效,因为它不需要使用额外的指针来表示树的结构。
本次以小堆举例进行讲解
typedef int HPDataType;
typedef struct Heap
{
HPDataType* a;
int size;
int capacity;
}HP;
HPDataType
被定义为 int
类型,表示堆中存储的数据类型。void HeapInit(HP* php)
{
assert(php);
php->a = NULL;
php->size = 0;
php->capacity = 0;
}
void HeapDestroy(HP* php)
{
assert(php);
free(php->a);
php->a = NULL;
php->capacity = php->size = 0;
}
void HeapPush(HP* php, HPDataType x)
{
assert(php);
if (php->size == php->capacity) {
int newCapacity = php->capacity == 0 ? 4 : php->capacity * 2;
HPDataType* tmp = (HPDataType*)realloc(php->a, newCapacity * sizeof(HPDataType));
if (tmp==NULL) {
perror("realloc fail");
return;
}
php->a = tmp;
php->capacity = newCapacity;
}
php->a[php->size] = x;
php->size++;
AdjustUp(php->a, php->size - 1);
}
后续函数会经常用到,同一串代码放到函数里供其使用者调用比较好。
void Swap(HPDataType* p1, HPDataType* p2)
{
HPDataType tmp = *p1;
*p1 = *p2;
*p2 = tmp;
}
void AdjustUp(HPDataType* a, int child)
{
int parent = (child - 1) / 2;
while (child > 0) {
if (a[child] < a[parent]) {
Swap(&a[child], &a[parent]);
child = parent;
parent = (child - 1) / 2;
}
else {
break;
}
}
}
bool HeapEmpty(HP* php)
{
assert(php);
return php->size == 0;
}
一般来说,堆的移除操作通常是移除堆顶元素,这样大堆小堆的性质保持不变,如果移除堆底会破坏堆的性质。
void HeapPop(HP* php)
{
assert(php);
assert(!HeapEmpty(php));
Swap(&php->a[0], &php->a[php->size - 1]);
php->size--;
AdjustDown(php->a, php->size, 0);
}
向下调整是从第一个节点(父节点)开始向下调整,传入参数命名为parent
void AdjustDown(HPDataType* a, int size, int parent)
{
int child = parent * 2 + 1;
while (child < size) {
if (child + 1 < size && a[child + 1] < a[child]) {
child++;
}
if (a[child] < a[parent]) {
Swap(&a[child], &a[parent]);
parent = child;
child = parent * 2 - 1;
}
else {
break;
}
}
}
child
更新为右子节点的索引,以确保选择更小的子节点进行比较。int HeapSize(HP* php)
{
assert(php);
return php->size;
}
我们先来看看这种方式:
void HeapSort(int* a, int n)
{
HP hp;
HeapInit(&hp);
// 时间复杂度:N*logN
for (int i = 0; i < n; ++i)
{
HeapPush(&hp, a[i]);
}
// 时间复杂度:N*logN
int i = 0;
while (!HeapEmpty(&hp))
{
int top = HeapTop(&hp);
a[i++] = top;
HeapPop(&hp);
}
HeapDestroy(&hp);
}
可以使用这种方式,但有诸多弊端:
我们要在传入的原数组上排降序,需要使用建小堆的方式向上或向下调整,使用这种方式是最优选择!!!
void HeapSort(int* a, int n)
{
// 建堆--向上调整建堆
for (int i = 1; i < n; i++)
{
AdjustUp(a, i);
}
int end = n - 1;
while (end > 0)
{
Swap(&a[0], &a[end]);
// 再调整,选出次小的数
AdjustDown(a, end, 0);
--end;
}
}
AdjustDown
函数,将堆的大小减一,再次将堆调整为最小堆。向下调整的时间复杂度为log(n)(下面有讲解),所以 HeapSort 的时间复杂度为O(nlog(n)),它不需要额外的空间来存储数据,所以是一种原地排序算法。它在最坏情况下的性能仍然是O(nlog(n)),因此相对稳定,适用于大规模数据的排序。
我们也可以向下建堆,而且一般都用向下调整建堆。
倒着调整叶子节点不需要处理(因为叶子节点没有子节点无法向下比较),从倒数第一个非叶子节点开始,即最后一个节点的父节点开始调整,从下往上向下建堆。
void HeapSort(int* a, int n)
{
for (int i = (n - 1 - 1) / 2; i >= 0; --i)
{
AdjustDown(a, n, i);
}
int end = n - 1;
while (end > 0)
{
Swap(&a[0], &a[end]);
AdjustDown(a, end, 0);
--end;
}
}
在HeapSort函数中,第一个循环调用了AdjustDown函数,将待排序数组构建成了一个小堆。但是,这个小堆并不是完全有序的,只是满足了小堆的性质,即每个节点的值都小于或等于其左右子节点的值。因此,需要进行第二个while循环,将小根堆中的元素依次取出,交换堆顶元素和数组末尾元素,并重新调整小堆,直到整个数组有序。
第二个while循环中,将堆顶元素与数组末尾元素交换,然后将剩余元素重新调整为小根堆。这样,每次交换后,数组末尾的元素就是当前小根堆中的最小值,而剩余元素仍然满足小根堆的性质。重复以上步骤,直到整个数组有序。
向上调整和向下调整哪种方式更好呢?
结论:向下建堆的时间复杂度比向上建堆小。
- 接下来我们来看看二者的时间复杂度如何计算
向下调整建堆计算过程如下:
向上调整建堆计算过程如下:
接下来我来看看堆排序的第二个应用场景:堆排序之“TOP-K”问题
#include
#include
#include
#include
typedef int HPDataType;
typedef struct Heap
{
HPDataType* a;
int size;
int capacity;
}HP;
void HeapInit(HP* php);
void HeapDestroy(HP* php);
void AdjustUp(HPDataType* a, int child);
void HeapPush(HP* php, HPDataType x);
bool HeapEmpty(HP* php);
void AdjustDown(int* a, int n, int parent);
void HeapPop(HP* php);
HPDataType HeapTop(HP* php);
int HeapSize(HP* php);
#include "Heap.h"
void HeapInit(HP* php)
{
assert(php);
php->a = NULL;
php->size = 0;
php->capacity = 0;
}
void HeapDestroy(HP* php)
{
assert(php);
free(php->a);
php->a = NULL;
php->capacity = php->size = 0;
}
void Swap(HPDataType* p1, HPDataType* p2)
{
HPDataType tmp = *p1;
*p1 = *p2;
*p2 = tmp;
}
void AdjustUp(HPDataType* a, int child)
{
int parent = (child - 1) / 2;
while (child>0) {
if (a[child] < a[parent]) {
Swap(&a[child], &a[parent]);
child = parent;
parent = (child - 1) / 2;
}
else {
break;
}
}
}
void HeapPush(HP* php, HPDataType x)
{
assert(php);
if (php->size == php->capacity) {
int newCapacity = php->capacity == 0 ? 4 : php->capacity * 2;
HPDataType* tmp = (HPDataType*)realloc(php->a, newCapacity * sizeof(HPDataType));
if (tmp==NULL) {
perror("realloc fail");
return;
}
php->a = tmp;
php->capacity = newCapacity;
}
php->a[php->size] = x;
php->size++;
AdjustUp(php->a, php->size - 1);
}
bool HeapEmpty(HP* php)
{
assert(php);
return php->size==0;
}
void AdjustDown(HPDataType* a, int size, int parent)
{
int child = parent * 2 + 1;
while (child < size) {
if (child + 1 < size && a[child + 1] < a[child]) {
child++;
}
if (a[child] < a[parent]) {
Swap(&a[child], &a[parent]);
parent = child;
child = parent * 2 - 1;
}
else {
break;
}
}
}
void HeapPop(HP* php)
{
assert(php);
assert(!HeapEmpty(php));
Swap(&php->a[0], &php->a[php->size - 1]);
php->size--;
AdjustDown(php->a, php->size, 0);
}
HPDataType HeapTop(HP* php)
{
assert(php);
assert(!HeapEmpty(php));
return php->a[0];
}
int HeapSize(HP* php)
{
assert(php);
return php->size;
}
#define _CRT_SECURE_NO_WARNINGS 1
#include "Heap.h"
void HeapSort(int* a, int n)
{
// 建堆--向上调整建堆
for (int i = 1; i < n; i++)
{
AdjustUp(a, i);
}
// 建堆--向下调整建堆
//for (int i = (n - 1 - 1) / 2; i >= 0; --i)
//{
// AdjustDown(a, n, i);
//}
int end = n - 1;
while (end > 0)
{
Swap(&a[0], &a[end]);
// 再调整,选出次小的数
AdjustDown(a, end, 0);
--end;
}
}
int main()
{
int a[] = { 7,8,3,5,1,9,5,4 };
HeapSort(a, sizeof(a) / sizeof(int));
for (int i = 0; i < 8; i++) {
printf("%d ", a[i]);
}
return 0;
}
//---测试堆函数功能---
//int main()
//{
// HP hp;
// HeapInit(&hp);
// int a[] = { 65,100,70,32,50,60 };
// for (int i = 0; i < sizeof(a) / sizeof(int); ++i)
// {
// HeapPush(&hp, a[i]);
// }
//
// while (!HeapEmpty(&hp))
// {
// int top = HeapTop(&hp);
// printf("%d\n", top);
// HeapPop(&hp);
// }
//
// return 0;
//}