前言 :
本篇文章将系统地分享我在学习二叉树中的心得,我会先简述一下树的概念及结构,然后引出二叉树的相关概念,理解了树的概念之后,会分别用顺序结构和链式结构来实现二叉树。其中二叉树的实现中,顺序结构的堆,以及链式结构可以说是非常令人头大。因此这两部分内容也是我本篇文章的分享重点,之后也会分享一些解决二叉树oj题的解题思路。目录中前两部分自我感觉较为繁琐可以跳过,但是堆 和 链式结构请一定认真看完。
同样作为数据结果的萌新,自认为我的语言更加贴近初学者,请点进来的各位新手一定耐心看完,相信我的分享一定能给你带来一些启发。同时文章中出现的错误也希望各位大佬指出,谢谢大家!!!
目录
1. 树的概念及结构
1.1 树的概念
1.2 树的相关概念
1.3 树的表示
1.4 树在实际中的应用
2. 二叉树的概念及结构
2.1 概念
2.2 特殊的二叉树
2.3 二叉树的性质
2.4 二叉树的存储结构
3. 二叉树的顺序结构及实现
3.1 二叉树的顺序结构
3.2 堆的概念及结构
3.3 堆的实现
3.3.1 堆向下调整算法
3.3.2 堆的创建
3.3.3 建堆时间复杂度
3.3.4 堆的插入
3.3.5 堆的删除
3.3.6 堆的具体代码
4.二叉树链式结构的实现
4.1 前置说明
4.2 二叉树的遍历
4.2.1 前序、中序以及后序遍历
前序遍历详解:
4.2.2 层序遍历
未完待续。。。。。。
树是一种非线性的数据结构,它是由n(n>=0)个有限结点组成一个具有层次关系的集合。把它叫做树是因为它看起来像一棵倒挂的树,也就是说它是根朝上,而叶朝下的。
注意:树形结构中,子树之间不能有交集,否则就不是树形结构
注意红色为常用的概念。
树结构相对线性表就比较复杂了,要存储表示起来就比较麻烦了,既然保存值域,也要保存结点和结点之间的关系,实际中树有很多种表示方式如:双亲表示法,孩子表示法、孩子双亲表示法以及孩子兄弟表示法等。我们这里就简单的了解其中最常用的孩子兄弟表示法。
typedef int DataType;
struct Node
{
struct Node* _firstChild1; // 第一个孩子结点
struct Node* _pNextBrother; // 指向其下一个兄弟结点
DataType _data; // 结点中的数据域
};
树结构在实际中应用还是挺广的。比如有目录树,菜单树,权限树,商品分类列表等等。
了解完树的概念之后,进入今天的重点二叉树
废话不说直接进入主题什么是二叉树?
一棵二叉树是结点的一个有限集合,该集合:
通俗来讲,二叉树就是度最大为2的树。
从上图我们也可以看出:
二叉树一般可以使用两种结构存储,一种顺序结构,一种链式结构。
1. 顺序存储
顺序结构存储就是使用数组来存储,一般使用数组只适合表示完全二叉树,因为不是完全二叉树会有空间的浪费。而现实中使用中只有堆才会使用数组来存储,关于堆我们后面的章节会专门讲解。二叉树顺序存储在物理上是一个数组,在逻辑上是一颗二叉树。
2.链式存储
二叉树的链式存储结构是指,用链表来表示一棵二叉树,即用链来指示元素的逻辑关系。 通常的方法是链表中每个结点由三个域组成,数据域和左右指针域,左右指针分别用来给出该结点左孩子和右孩子所在的链结点的存储地址 。链式结构又分为二叉链和三叉链,今天我分享的都是二叉链。
typedef int BTDataType;
// 二叉链
struct BinaryTreeNode
{
struct BinTreeNode* pLeft; // 指向当前节点左孩子
struct BinTreeNode* pRight; // 指向当前节点右孩子
BTDataType data; // 当前节点值域
}
普通的二叉树是不适合用数组来存储的,因为可能会存在大量的空间浪费。而完全二叉树更适合使用顺序结构存储。现实中我们通常把堆(一种二叉树)使用顺序结构的数组来存储,需要注意的是这里的堆和操作系统虚拟进程地址空间中的堆是两回事,一个是数据结构,一个是操作系统中管理内存的一块区域分段。
堆的性质:
现在我们给出一个数组,逻辑上看做一颗完全二叉树。我们通过从根节点开始的向下调整算法可以把它调整成一个小堆。向下调整算法有一个前提:左右子树必须是一个堆,才能调整。
int array[] = {27,15,19,18,28,34,65,49,25,37}
下面我们给出一个数组,这个数组逻辑上可以看做一颗完全二叉树,但是还不是一个堆,现在我们通过算法,把它构建成一个堆。根节点左右子树不是堆,我们怎么调整呢?这里我们从倒数的第一个非叶子节点的子树开始调整,一直调整到根节点的树,就可以调整成堆。
因为堆是完全二叉树,而满二叉树也是完全二叉树,此处为了简化使用满二叉树来证明(时间复杂度本来看的就是近似值,多几个节点不影响最终结果):
因此,建堆的时间复杂度为O(N)
删除堆是删除堆顶的数据,将堆顶的数据根最后一个数据一换,然后删除数组最后一个数据,再进行向下调整算法。
https://gitee.com/hrimkn/c_code
如果想下载参考代码可以点击此链接。
Heap.h
#pragma once
#include
#include
#include
#include
typedef int HPDataType;
typedef struct Heap
{
HPDataType* a;
int size;
int capacity;
}Heap;
// 堆的初始化
void HeapCreate(Heap* hp);
// 堆的销毁
void HeapDestory(Heap* hp);
// 堆的插入
void HeapPush(Heap* hp, HPDataType x);
// 堆的删除
void HeapPop(Heap* hp);
// 取堆顶的数据
HPDataType HeapTop(Heap* hp);
// 堆的数据个数
int HeapSize(Heap* hp);
// 堆的判空
bool HeapEmpty(Heap* hp);
//打印堆
void PrintHeap(Heap* hp);
void AdjustDown(HPDataType* a, int n, int parent);
void swap(HPDataType* p1, HPDataType* p2);
Heap.c
#include "Heap.h"
// 堆的初始化
void HeapCreate(Heap* hp)
{
assert(hp);
hp->a = NULL;
hp->capacity = hp->size = 0;
}
// 堆的销毁
void HeapDestory(Heap* hp)
{
assert(hp);
free(hp->a);
hp->a = NULL;
hp->capacity = hp->size = 0;
}
void swap(HPDataType*p1, HPDataType*p2)
{
HPDataType tmp = *p1;
*p1 = *p2;
*p2 = tmp;
}
//向上调整
void AdjustUp(HPDataType* a, int child)
{
int parent = (child - 1) / 2;
while (child > 0)
{
if (a[child] < a[parent])
{
swap(&a[child], &a[parent]);
child = parent;
parent = (child - 1) / 2;
}
else
break;
}
}
// 堆的插入
void HeapPush(Heap* hp, HPDataType x)
{
assert(hp);
//检查是否需要扩容
if (hp->size == hp->capacity)
{
int newcapacity = hp->capacity == 0 ? 4 : hp->capacity * 2;
HPDataType* tmp = (HPDataType*)realloc(hp->a, sizeof(HPDataType) * newcapacity);
if (tmp == NULL)
{
perror("realloc fail");
exit(-1);
}
hp->a = tmp;
}
hp->a[hp->size] = x;
hp->size++;
AdjustUp(hp->a, hp->size - 1);
}
void AdjustDown(HPDataType* a,int n,int parent)
{
int minchild = parent * 2 + 1;
while (minchild < n)
{
if ( minchild+1 < n && a[minchild] < a[minchild + 1] )
{
minchild++;
}
if (a[minchild] > a[parent])
{
swap(&a[minchild], &a[parent]);
parent = minchild;
minchild = parent * 2 + 1;
}
else
break;
}
}
// 堆的删除
void HeapPop(Heap* hp)
{
assert(hp);
assert(!HeapEmpty(hp));
swap(&hp->a[0], &hp->a[hp->size - 1]);
hp->size--;
AdjustDown(hp->a, hp->size, 0);
}
// 取堆顶的数据
HPDataType HeapTop(Heap* hp)
{
if (hp->size == 0)
return 0;
return hp->a[0];
}
// 堆的数据个数
int HeapSize(Heap* hp)
{
return hp->size - 1;
}
// 堆的判空
bool HeapEmpty(Heap* hp)
{
return hp->size == 0;
}
//打印堆
void PrintHeap(Heap* hp)
{
for (int i = 0; i < hp->size; i++)
{
printf("%d ", hp->a[i]);
}
printf("\n");
}
在学习二叉树的基本操作前,需先要创建一棵二叉树,然后才能学习其相关的基本操作。由于现在对二叉树结构掌握还不够深入,为了降低学习成本,此处手动快速创建一棵简单的二叉树,快速进入二叉树操作学习,等二叉树结构了解的差不多时,我们反过头再来研究二叉树真正的创建方式。
同时,二叉树链式结构的大部分代码都是通过递归实现的,代码写起来比较简单,但是理解过程我自己认为十分困难,但理解之后,对于二叉树的操作可以说是得心应手。所以各位在学习这一部分时不要着急,仔细思考之后可能在某一瞬间就会豁然开朗。体会到‘‘山重水复疑无路,柳暗花明又一村”的感觉!
注意:下面是二叉树链式结构的创建函数,我是在学完二叉树才写出来的这个函数,因此初学者大致看一遍跳过即可,等最后可以回过头来再思考。
//二叉树链式结构的构建函数
#include
#include
struct TreeNode {
char data;
struct TreeNode *left;
struct TreeNode *right;
};
struct TreeNode* CreatTree(char* a,int* pi)
{
if(a[*pi] == '#')
{
(*pi)++;
return NULL;
}
struct TreeNode* root =(struct TreeNode*)malloc(sizeof(struct TreeNode));
if(root == NULL)
{
perror("malloc error");
return NULL;
}
root->data = a[*pi];
(*pi)++;
root->left = CreatTree(a, pi);
root->right = CreatTree(a, pi);
return root;
}
我们先来回顾一下上文提到的二叉树的概念,二叉树是:
从概念中可以看出,二叉树定义是递归式的,因此后序基本操作中基本都是按照该概念实现的
//二叉树简单无脑的创建方式
typedef int BTDataType;
typedef struct BinaryTreeNode
{
BTDataType _data;
struct BinaryTreeNode* left;
struct BinaryTreeNode* right;
}BTNode;
BTNode* CreateTree()
{
BTNode* n1 = (BTNode*)malloc(sizeof(BTNode));
assert(n1);
BTNode* n2 = (BTNode*)malloc(sizeof(BTNode));
assert(n2);
BTNode* n3 = (BTNode*)malloc(sizeof(BTNode));
assert(n3);
BTNode* n4 = (BTNode*)malloc(sizeof(BTNode));
assert(n4);
BTNode* n5 = (BTNode*)malloc(sizeof(BTNode));
assert(n5);
BTNode* n6 = (BTNode*)malloc(sizeof(BTNode));
assert(n6);
n1->data = 1;
n2->data = 2;
n3->data = 3;
n4->data = 4;
n5->data = 5;
n6->data = 6;
n1->left = n2;
n1->right = n4;
n2->left = n3;
n2->right = NULL;
n4->left = n5;
n4->right = n6;
n3->left = NULL;
n3->right = NULL;
n5->left = NULL;
n5->right = NULL;
n6->left = NULL;
n6->right = NULL;
return n1;
}
请先用上面的代码简单地创建图中的二叉树,方便理解下面要提到的内容,同时也方便自己进行调试代码。
学习二叉树结构,最简单的方式就是遍历。所谓二叉树遍历(Traversal)是按照某种特定的规则,依次对二叉树中的节点进行相应的操作,并且每个节点只操作一次。访问结点所做的操作依赖于具体的应用问题。 遍历是二叉树上最重要的运算之一,也是二叉树上进行其它运算的基础。
按照规则,二叉树的遍历有:前序/中序/后序的递归结构遍历:
我先给出上图中二叉树三种遍历的结果
现在请看一下结果,不必考虑为什么,等看完下面的内容后再回过头来想一想这么写合适不合适,如果看出来不合适的地方,那么就可以恭喜你了!
此外由于被访问的结点必是某子树的根,所以N(Node)、L(Left subtree)和R(Right subtree)又可解释为根、根的左子树和根的右子树。NLR、LNR和LRN分别又称为先根遍历、中根遍历和后根遍历。(了解这种叫法即可)
二叉树的前序、中序以及后序遍历原理相同,只需要了解一种的实现方式便可以融汇贯通,因此在这里我就以前序为例展开。
请再读一遍前序遍历的概念:访问根结点的操作发生在遍历其左右子树之前。
也就是说遍历二叉树的时候 先访问根节点 然后访问根的左子树 最后访问根的右子树
首先看下面的图片将这个二叉树的根节点传给前序遍历函数,(请图文一起观看)
所以现在你理解了整个过程,是不是发现上面我一开始给出的结果有些许不妥。
理解前序遍历之后,请自己写出中序和后序遍历带NULL的结果。
下面是具体代码,中序和后序遍历只需要调换一下顺序即可。
相信你看懂了上面的过程,很轻松就能写出代码。
// 二叉树前序遍历
void PreOrder(BTNode* root)
{
if (root == NULL)
{
printf("NULL ");
return;
}
printf("%d ", root->data);
PreOrder(root->left);
PreOrder(root->right);
}
层序遍历:除了先序遍历、中序遍历、后序遍历外,还可以对二叉树进行层序遍历。设二叉树的根节点所在层数为1,层序遍历就是从所在二叉树的根节点出发,首先访问第一层的树根节点,然后从左到右访问第2层上的节点,接着是第三层的节点,以此类推,自上而下,自左至右逐层访问树的结点的过程就是层序遍历。
由于上面语言叙述前序遍历过程实在过于麻烦,消耗了我太多精力,层序遍历的过程更加麻烦,并且使用到了队列,所以这里我就跳过了直接看代码吧。十分抱歉!(之后我会想好怎么叙述更清楚会更新讲解)
void TreeLevelOrder(BTNode* root)
{
Queue q;
QueueInit(&q);
if (root)
QueuePush(&q, root);
while (!QueueEmpty(&q))
{
BTNode* front = QueueFront(&q);
QueuePop(&q);
printf("%d ", front->data);
// 下一层,入队列
if (front->left)
QueuePush(&q, front->left);
if (front->right)
QueuePush(&q, front->right);
}
printf("\n");
QueueDestroy(&q);
}