目录
一.树的概念及结构
1.1树的概念
1.2 树的相关概念
1.3树的表示
1.4树在实际中的运用(表示文件系统的目录树结构)
二. 二叉树的概念及结构
2.1概念
2.2特殊二叉树
2.3二叉树的存储结构
三.堆
3.1堆的概念及结构
3.2堆的实现
3.2.1 堆向上调整算法
3.2.2 堆的插入
3.2.3堆的删除
3.2.4总代码
3.3堆的应用
3.3.1堆的排序
3.3.2TOP-K问题
四.二叉树链式结构的实现
4.1前置说明
4.2二叉树的遍历
4.3节点个数以及高度等
树是一种非线性的数据结构,它是由n(n>=0)个有限结点组成一个具有层次关系的集合。把它叫做树是因为它看起来像一棵倒挂的树,也就是说它是根朝上,而叶朝下的。
注意:树形结构中,子树之间不能有交集,否则就不是树形结构
树结构相对线性表就比较复杂了,要存储表示起来就比较麻烦了,既然保存值域,也要保存结点和结点之间的关系,实际中树有很多种表示方式如:双亲表示法,孩子表示法、孩子双亲表示法以及孩子兄弟表示法等。我们这里就简单的了解其中最常用的孩子兄弟表示法。
一棵二叉树是结点的一个有限集合,该集合:
1. 或者为空
2. 由一个根节点加上两棵别称为左子树和右子树的二叉树组成
从上图可以看出:
1. 二叉树不存在度大于2的结点
2. 二叉树的子树有左右之分,次序不能颠倒,因此二叉树是有序树
1. 满二叉树:一个二叉树,如果每一个层的结点数都达到最大值,则这个二叉树就是满二叉树。也就是说,如果一个二叉树的层数为K,且结点总数是 ,则它就是满二叉树。
2. 完全二叉树:完全二叉树是效率很高的数据结构,完全二叉树是由满二叉树而引出来的。对于深度为K的,有n个结点的二叉树,当且仅当其每一个结点都与深度为K的满二叉树中编号从1至n的结点一一对应时称之为完全二叉树。 要注意的是满二叉树是一种特殊的完全二叉树。
性质:
1. 若规定根节点的层数为1,则一棵非空二叉树的第i层上最多有 2^(i-1)个结点.
2. 若规定根节点的层数为1,则深度为h的二叉树的最大结点数是2^h-1 .
3. 对任何一棵二叉树, 如果度为0其叶结点个数为n0 , 度为2的分支结点个数为n2 ,则有n0 =n2 +1
4. 若规定根节点的层数为1,具有n个结点的满二叉树的深度,h=log(n+1) . (ps:log(n+1) 是log以2为底,n+1为对数)
5. 对于具有n个结点的完全二叉树,如果按照从上至下从左至右的数组顺序对所有节点从0开始编号,则对于序号为i的结点有:
1. 若i>0,i位置节点的双亲序号:(i-1)/2;i=0,i为根节点编号,无双亲节点
2. 若2i+1
3. 若2i+2
在数组上这样表示
二叉树一般可以使用两种结构存储,一种顺序结构,一种链式结构。
1. 顺序存储
顺序结构存储就是使用数组来存储,一般使用数组只适合表示完全二叉树,因为不是完全二叉树会有空间的浪费。而现实中使用中只有堆才会使用数组来存储,关于堆我们后面的章节会专门讲解。二叉树顺序存储在物理上是一个数组,在逻辑上是一颗二叉树。
2. 链式存储
二叉树的链式存储结构是指,用链表来表示一棵二叉树,即用链来指示元素的逻辑关系。 通常的方法是链表中每个结点由三个域组成,数据域和左右指针域,左右指针分别用来给出该结点左孩子和右孩子所在的链结点的存储地址 。链式结构又分为二叉链和三叉链,当前我们学习中一般都是二叉链,后面课程学到高阶数据结构如红黑树等会用到三叉链。
typedef int BTDataType;
// 二叉链
struct BinaryTreeNode
{
struct BinTreeNode* _pLeft; // 指向当前节点左孩子
struct BinTreeNode* _pRight; // 指向当前节点右孩子
BTDataType _data; // 当前节点值域
}
// 三叉链
struct BinaryTreeNode
{
struct BinTreeNode* _pParent; // 指向当前节点的双亲
struct BinTreeNode* _pLeft; // 指向当前节点左孩子
struct BinTreeNode* _pRight; // 指向当前节点右孩子
BTDataType _data; // 当前节点值域
};
普通的二叉树是不适合用数组来存储的,因为可能会存在大量的空间浪费。而完全二叉树更适合使用顺序结构存储。
现实中我们通常把堆(一种二叉树)使用顺序结构的数组来存储,需要注意的是这里的堆和操作系统虚拟进程地址空间中的堆是两回事,一个是数据结构,一个是操作系统中管理内存的一块区域分段。
堆的性质:
小堆/小根堆 大堆/大根堆
树中父亲都小于等于他的孩子; 树中父亲都大于等于他的孩子;
注意:两个孩子不分大小。
现在我们给出一个数组,逻辑上看做一颗完全二叉树。我们通过从根节点开始的向下调整算法可以把它调整成一个小堆。向下调整算法有一个前提:左右子树必须是一个堆,才能调整。
void AdjustUp(HPDataType* a, size_t child) {
size_t parent = (child - 1) / 2;
while (child > 0)
{
//小堆
if (a[child] < a[parent])
{
//交换
Swap(&a[child], &a[parent]);
child = parent;
parent = (child - 1) / 2;
}
else
{
break;
}
}
}
先插入一个10到数组的尾上,再进行向上调整算法,直到满足堆。
//插入
void HeapPush(HP* php, HPDataType x) {
assert(php);
if (php->size==php->capacity)
{
size_t newCapacity = php->capacity == 0 ? 4 : php->capacity * 2;
HPDataType* tmp = realloc(php->a, sizeof(HPDataType) * newCapacity);
if (tmp==NULL)
{
printf("realloc fail\n");
exit(-1);
}
else
{
php->a = tmp;
php->capacity = newCapacity;
}
}
php->a[php->size] = x;
php->size++;
// 向上调整,控制保持是一个小堆
AdjustUp(php->a, php->size - 1);
}
删除堆是删除堆顶的数据,将堆顶的数据根最后一个数据一换,然后删除数组最后一个数据,再进行向下调整算法。
//向下调整
void AdjustDown(HPDataType * a,size_t size,size_t root) {
size_t praent = root;
size_t child = praent*2+1;
while (childsize > 0);
Swap(&php->a[0], &php->a[php->size - 1]);
php->size--;
//向下调整
AdjustDown(php->a, php->size, 0);
}
#include "Heap.h"
//初始化
void HeapInit(HP* php) {
assert(php);
php->a = NULL;
php->size = php->capacity = 0;
}
//销毁
void HeapDestroy(HP* php) {
assert(php);
free(php->a);
php->a = NULL;
php->size = php->capacity = 0;
}
//打印
void HeapPrint(HP* php) {
assert(php);
int i = 0;
for ( i = 0; i <( php->size); i++)
{
printf("%d ", php->a[i]);
}
printf("\n");
}
//交换
void Swap(HPDataType* pa, HPDataType* pb) {
HPDataType tmp =* pa;
*pa =* pb;
*pb = tmp;
}
// 向上调整,控制保持是一个小堆
void AdjustUp(HPDataType* a, size_t child) {
size_t parent = (child - 1) / 2;
while (child > 0)
{
//小堆
if (a[child] < a[parent])
{
//交换
Swap(&a[child], &a[parent]);
child = parent;
parent = (child - 1) / 2;
}
else
{
break;
}
}
}
//插入
void HeapPush(HP* php, HPDataType x) {
assert(php);
if (php->size==php->capacity)
{
size_t newCapacity = php->capacity == 0 ? 4 : php->capacity * 2;
HPDataType* tmp = realloc(php->a, sizeof(HPDataType) * newCapacity);
if (tmp==NULL)
{
printf("realloc fail\n");
exit(-1);
}
else
{
php->a = tmp;
php->capacity = newCapacity;
}
}
php->a[php->size] = x;
php->size++;
// 向上调整,控制保持是一个小堆
AdjustUp(php->a, php->size - 1);
}
//向下调整
void AdjustDown(HPDataType * a,size_t size,size_t root) {
size_t praent = root;
size_t child = praent*2+1;
while (childsize > 0);
Swap(&php->a[0], &php->a[php->size - 1]);
php->size--;
//向下调整
AdjustDown(php->a, php->size, 0);
}
//判空
bool HeapEmpty(HP* php) {
assert(php);
return php->size==0;
}
//数量
size_t HeapSize(HP* php) {
assert(php);
return php->size;
}
//取头
HPDataType HeapTop(HP* php) {
assert(php);
return php->a[0];
}
#pragma once
#include
#include
#include
#include
typedef int HPDataType;
typedef struct MyStruct
{
HPDataType* a;
size_t size;
size_t capacity;
}HP;
//初始化
void HeapInit(HP* php);
//销毁
void HeapDestroy(HP* php);
//打印
void HeapPrint(HP* php);
//插入
void HeapPush(HP* php, HPDataType x);
//删除
void HeapPop(HP* php);
//判空
bool HeapEmpty(HP* php);
//数量
size_t HeapSize(HP* php);
//取头
HPDataType HeapTop(HP* php);
堆排序即利用堆的思想来进行排序
代码如下:
void Text(int* a, int sz) {
HP st;
HeapInit(&st);
for (int i = 0; i < sz; i++)
{
HeapPush(&st, a[i]); //插入,创建堆 (这里我建的小堆)
}
size_t j = 0;
while (!HeapEmpty(&st))
{
a[j] = HeapTop(&st); //依次出推
j++;
HeapPop(&st); //删除
}
HeapDestroy(&st);
}
int main() {
int a[] = {8,5,9,6,2,1,4};
Text(a,sizeof(arr)/sizeof(int));
for (int i = 0; i < sizeof(a) / sizeof(int); ++i)
{
printf("%d ", a[i]);
}
printf("\n");
return 0;
}
但是这里时间复杂度 O(N*logN) ,空间复杂度O(N)。
还可以优化:
总共分为两个步骤:
1. 建堆
2. 利用堆删除思想来进行排序
两种方法
一.向上调整算法
void AdjustUp(HPDataType* a, size_t child) {
size_t parent = (child - 1) / 2;
while (child > 0)
{
//小堆
if (a[child] < a[parent])
{
//交换
Swap(&a[child], &a[parent]);
child = parent;
parent = (child - 1) / 2;
}
else
{
break;
}
}
}
void HeapSort(int* a, int n) {
//建堆时间复杂度O(N*logN) 空间复杂度为O(1)
for (int i = 0; i < n; i++)
{
AdjustUp(a, i);//建堆
}
size_t end = n - 1;
while (end > 0)
{
Swap(&a[0], &a[end]);
AdjustDown(a, end, 0); //排序
--end;
}
}
int main() {
int a[] = {8,5,9,6,2,1,4};
HeapSort(a, sizeof(a) / sizeof(int));
for (int i = 0; i < sizeof(a) / sizeof(int); ++i)
{
printf("%d ", a[i]);
}
printf("\n");
return 0;
}
二.向下调整算法
void AdjustDown(HPDataType * a,size_t size,size_t root) {
size_t praent = root;
size_t child = praent*2+1;
while (child
void HeapSort(int* a, int n) {
//建堆时间复杂度为O(N) 空间复杂度为O(1)
for (int i = (n-1-1)/2; i >= 0; i--)//这里不能直接建堆,
//向下调整算法需要左右子树都要是堆才行,所以这里我们倒着来,
//从倒数第一个非叶子节点(最后一个节点的父亲),依次往后调。
{
AdjustDown(a, n, i);
}
size_t end = n - 1;
while (end > 0)
{
Swap(&a[0], &a[end]);
AdjustDown(a, end, 0);//排序
--end;
}
}
int main() {
int a[] = {8,5,9,6,2,1,4};
HeapSort(a, sizeof(a) / sizeof(int));
for (int i = 0; i < sizeof(a) / sizeof(int); ++i)
{
printf("%d ", a[i]);
}
printf("\n");
return 0;
}
排序的实现:
我们定义数组a[] = {8,5,9,6,2,1,4},排一个小堆为
然后降序
1.先把第一个跟最后一个交换成8,2,4,6,5,9,1;Swap(&a[0], &a[end]);
2.然后把最后一个给“去掉”(不算最后一个)接下来的有效数为8,2,4,6,5,9;(第一次end=n-1)所以第一次不需要减减
3.再选出第二小的 AdjustDown(a, end, 0);
依次循环。当end=0时候停下来。
建大堆升序的时候依旧如此。
TOP-K问题:即求数据结合中前K个最大的元素或者最小的元素,一般情况下数据量都比较大。
比如:专业前10名、世界500强、富豪榜、游戏中前100的活跃玩家等.
对于Top-K问题,能想到的最简单直接的方式就是排序,但是:如果数据量非常大,排序就不太可取了(可能数据都不能一下子全部加载到内存中)。最佳的方式就是用堆来解决
基本思路如下:
1. 用数据集合中前K个元素来建堆
2,用剩余的N-K个元素依次与堆顶元素来比较,不满足则替换堆顶元素
将剩余N-K个元素依次与堆顶元素比完之后,堆中剩余的K个元素就是所求的前K个最小或者最大的元素。
void PrintTopK(int* a, int n, int k) {
// 1. 建堆--用a中前k个元素建堆
int* kminHeap = (int*)malloc(sizeof(int) * k);
assert(kminHeap);
for (int i = 0; i < k; i++)
{
kminHeap[i] = a[i];
}
//建小堆
for (int j = (k - 1 - 1) / 2; j >= 0; j--)
{
AdjustDown(kminHeap, k, j);
}
// 2. 将剩余n-k个元素依次与堆顶元素交换,不满则则替换
for (int i = k; i < n; i++)
{
if (a[i] > kminHeap[0])
{
kminHeap[0] = a[i];
AdjustDown(kminHeap, k, 0);
}
}
for (int j = 0; j < k; ++j)
{
printf("%d ", kminHeap[j]);
}
printf("\n");
free(kminHeap);
}
void TestTopk()
{
int n = 10000;
int* a = (int*)malloc(sizeof(int)*n);
srand(time(0));//随机
for (size_t i = 0; i < n; ++i)
{
a[i] = rand() % 1000000;//把数控制在1000000以内
}
a[5] = 1000000 + 1;
a[1231] = 1000000 + 2;
a[531] = 1000000 + 3;
a[5121] = 1000000 + 4;
a[115] = 1000000 + 5;
a[2305] = 1000000 + 6;
a[99] = 1000000 + 7;
a[76] = 1000000 + 8;
a[423] = 1000000 + 9;
a[55] = 1000000 + 1000;
PrintTopK(a, n, 10);
}
int main() {
TestTopk();
return 0;
}
在学习二叉树的基本操作前,需先要创建一棵二叉树,然后才能学习其相关的基本操作。由于现在大家对二叉树结构掌握还不够深入,为了降低大家学习成本,此处手动快速创建一棵简单的二叉树,快速进入二叉树操作学习,等二叉树结构了解的差不多时,我们反过头再来研究二叉树真正的创建方式。
typedef int BTDataType;
typedef struct BinaryTreeNode
{
BTDataType data;
struct BinaryTreeNode* left;
struct BinaryTreeNode* right;
}BTNode;
BTNode* BuyBTNode(BTDataType x) {
BTNode* node = (BTNode*)malloc(sizeof(BTNode));
if (node==NULL)
{
printf("malloc fail\n");
exit(-1);
}
node->data = x;
node->left = node->right = NULL;
return node;
}
BTNode* CreatBinaryTree()
{
BTNode* node1 = BuyBTNode(1);
BTNode* node2 = BuyBTNode(2);
BTNode* node3 = BuyBTNode(3);
BTNode* node4 = BuyBTNode(4);
BTNode* node5 = BuyBTNode(5);
BTNode* node6 = BuyBTNode(6);
node1->left = node2;
node1->right = node4;
node2->left = node3;
node4->left = node5;
node4->right = node6;
return node1;
}
注意:上述代码并不是创建二叉树的方式,真正创建二叉树方式后序详解重点讲解。
再看二叉树基本操作前,再回顾下二叉树的概念,二叉树是:
1. 空树
2. 非空:根节点,根节点的左子树、根节点的右子树组成的。
从概念中可以看出,二叉树定义是递归式的 ,因此后序基本操作中基本都是按照该概念实现的。
学习二叉树结构,最简单的方式就是遍历。所谓二叉树遍历(Traversal)是按照某种特定的规则,依次对二叉树中的节点进行相应的操作,并且每个节点只操作一次。访问结点所做的操作依赖于具体的应用问题。 遍历是二叉树上最重要的运算之一,也是二叉树上进行其它运算的基础。
按照规则,二叉树的遍历有:前序/中序/后序的递归结构遍历:
1. 前序遍历(Preorder Traversal 亦称先序遍历)——访问根结点的操作发生在遍历其左右子树之前。
void PrevOrder(BTNode* root) {
if (root == NULL) {
printf("NULL ");
return;
}
printf("%d ", root->data);
PrevOrder(root->left);
PrevOrder(root->right);
}
2. 中序遍历(Inorder Traversal)——访问根结点的操作发生在遍历其左右子树之中(间)。
void InOrder(BTNode* root) {
if (root == NULL)
{
printf("NULL ");
return;
}
InOrder(root->left);
printf("%d ", root->data);
InOrder(root->right);
}
3. 后序遍历(Postorder Traversal)——访问根结点的操作发生在遍历其左右子树之后。
跟上述差不多,我就不画了嘿嘿。
由于被访问的结点必是某子树的根,所以N(Node)、L(Left subtree)和R(Right subtree)又可解释为根、根的左子树和根的右子树。NLR、LNR和LRN分别又称为先根遍历、中根遍历和后根遍历.
1.二叉树节点个数
int BTreeSize(BTNode* root) {
return root == NULL ? 0 : BTreeSize(root->left)
+ BTreeSize(root->right) + 1; //这里的1加它自己
}
把图中所有蓝色箭头上的数字加起来为6
例如:校长想统计同学到校人数
2.二叉树叶子节点个数
int BTreeLeafSize(BTNode* root) {
if (root==NULL){
return 0;
}
if (root->left == NULL && root->right == NULL) {
return 1;
}
return BTreeLeafSize(root->left) + BTreeLeafSize(root->right);
}
3.二叉树第k层节点个数
int BTreeKLevelSize(BTNode* root, int k) {
assert(k >= 1);
if (root==NULL)
{
return 0;
}
if (k==1)
{
return 1;
}
return BTreeKLevelSize(root->left, k - 1) + BTreeKLevelSize(root->right, k - 1);
}
4.二叉树的深度
思路:
int BTreeDepth(BTNode* root) {
if (root==NULL)
{
return 0;
}
int leftDepth = BTreeDepth(root->left);
int rightDepth = BTreeDepth(root->right);
return leftDepth > rightDepth ? leftDepth + 1 : rightDepth + 1;
}
5.二叉树查找值为x的节点
BTNode* BTreeFind(BTNode* root, BTDataType x) {
if (root==NULL){
return;
}
if (root->data==x){
return root;
}
BTNode* ret1 = BTreeFind(root->left, x);
if (ret1){
return ret1;
}
BTNode* ret2 = BTreeFind(root->right, x);
if (ret2){
return ret2;
}
return NULL;
}
6.层序遍历
层序遍历:除了先序遍历、中序遍历、后序遍历外,还可以对二叉树进行层序遍历。设二叉树的根节点所在层数为1,层序遍历就是从所在二叉树的根节点出发,首先访问第一层的树根节点,然后从左到右访问第2层上的节点,接着是第三层的节点,以此类推,自上而下,自左至右逐层访问树的结点的过程就是层序遍历。
所以这里需要一个队列
#pragma once
#include
#include
#include
#include
struct BinaryTreeNode;
typedef struct BinaryTreeNode* QDataType;
typedef struct QueueNode
{
QDataType data;
struct QueueNode* next;
}QNode;
typedef struct Queue
{
QNode* head;
QNode* tail;
}Queue;
//初始化
void QueueInit(Queue* pq);
//销毁队列
void QueueDestory(Queue* pq);
//插入
void QueuePush(Queue* pq, QDataType x);
//删除
void QueuePop(Queue* pq);
//判断是否为空
bool QueueEmpty(Queue* pq);
//有效个数
size_t QueueSize(Queue* pq);
// 获取队列头部元素
QDataType QueueFront(Queue* pq);
//获取队列队尾元素
QDataType QueueBack(Queue* pq);
#include "Queu.h"
//初始化
void QueueInit(Queue* pq) {
assert(pq);
pq->head = pq->tail = NULL;
}
//销毁队列
void QueueDestory(Queue* pq) {
assert(pq);
QNode* cur = pq->head;
while (cur)
{
QNode* next = cur->next;
free(cur);
cur = next;
}
pq->head = pq->tail = NULL;
}
//插入
void QueuePush(Queue* pq, QDataType x) {
assert(pq);
QNode* newnode = (QNode*)malloc(sizeof(QNode));
assert(newnode);
newnode->data = x;
newnode->next = NULL;
if (pq->tail==NULL)
{
assert(pq->head == NULL);
pq->head = pq->tail = newnode;
}
else
{
pq->tail->next = newnode;
pq->tail = newnode;
}
}
//删除
void QueuePop(Queue* pq) {
assert(pq);
assert(pq->head && pq->tail);
if (pq->head->next==NULL)
{
free(pq->head);
pq->head = pq->tail = NULL;
}
else
{
QNode* next = pq->head->next;
free(pq->head);
pq->head = next;
}
}
//判断是否为空
bool QueueEmpty(Queue* pq) {
assert(pq);
return pq->head == NULL;
}
//有效个数
size_t QueueSize(Queue* pq) {
assert(pq);
QNode* cur = pq->head;
size_t size = 0;
while (cur)
{
size++;
cur = cur->next;
}
return size;
}
// 获取队列头部元素
QDataType QueueFront(Queue* pq) {
assert(pq);
assert(pq->head);
return pq->head->data;
}
//获取队列队尾元素
QDataType QueueBack(Queue* pq) {
assert(pq);
assert(pq->tail);
return pq->tail->data;
}
void LevelOrder(BTNode* root) {
Queue q;
QueueInit(&q);
if (root)
{
QueuePush(&q, root);
}
while (!QueueEmpty(&q))
{
BTNode* front = QueueFront(&q);
QueuePop(&q);
printf("%d ", front->data);
if (front->left)
{
QueuePush(&q, front->left);
}
if (front->right)
{
QueuePush(&q, front->right);
}
}
printf("\n");
QueueDestory(&q);
}
7,判断是否为二叉树
思路:
bool BinaryTreeComplete(BTNode* root) {
Queue q;
QueueInit(&q);
if (root)
{
QueuePush(&q, root);
}
while (!QueueEmpty(&q))
{
BTNode* front = QueueFront(&q);
QueuePop(&q);
if (front==NULL)
{
break;
}
QueuePush(&q, front->left);
QueuePush(&q, front->right);
}
while (!QueueEmpty(&q))
{
BTNode* front = QueueFront(&q);
QueuePop(&q);
if (front)
{
return false;
}
}
return true;
}