树是一种非线性的数据结构,它是由n(n>=0)个有限结点组成一个具有层次关系的集合。把它叫做树是因为它看起来像一棵倒挂的树,也就是说它是根朝上,而叶朝下的。
注意:树形结构中,子树之间不能有交集,否则就不是树形结构。
树结构相对线性表就比较复杂了,要存储表示起来就比较麻烦了,既然保存值域,也要保存结点和结点之间的关系,实际中树有很多种表示方式如:双亲表示法,孩子表示法、孩子双亲表示法以及孩子兄弟表示法等。我们这里就简单的了解其中最常用的孩子兄弟表示法。
typedef int DataType;
struct Node
{
struct Node* _firstChild1; // 第一个孩子结点
struct Node* _pNextBrother; // 指向其下一个兄弟结点
DataType _data; // 结点中的数据域
};
一棵二叉树是结点的一个有限集合,该集合:
从上图可以看出:
注意:对于任意的二叉树都是由以下几种情况复合而成的:
下面有几道题来帮助大家理解二叉树的性质:
1… 某二叉树共有 399 个结点,其中有 199 个度为 2 的结点,则该二叉树中的叶子结点数为( B )
A 不存在这样的二叉树
B 200
C 198
D 199
2. 下列数据结构中,不适合采用顺序存储结构的是( A )
A 非完全二叉树
B 堆(类似于完全二叉树)
C 队列
D 栈
3. 在具有 2n 个结点的完全二叉树中,叶子结点个数为( A )
A n
B n+1
C n-1
D n/2
4. 一棵完全二叉树的节点数位为531个,那么这棵树的高度为( B )
A 11
B 10
C 8
D 12
5. 一个具有767个节点的完全二叉树,其叶子节点个数为( B )
A 383
B 384
C 385
D 386
二叉树一般可以使用两种结构存储,一种顺序结构,一种链式结构。
typedef int BTDataType;
// 二叉链
struct BinaryTreeNode
{
struct BinTreeNode* _pLeft; // 指向当前节点左孩子
struct BinTreeNode* _pRight; // 指向当前节点右孩子
BTDataType _data; // 当前节点值域
}
// 三叉链
struct BinaryTreeNode
{
struct BinTreeNode* _pParent; // 指向当前节点的双亲
struct BinTreeNode* _pLeft; // 指向当前节点左孩子
struct BinTreeNode* _pRight; // 指向当前节点右孩子
BTDataType _data; // 当前节点值域
};
普通的二叉树是不适合用数组来存储的,因为可能会存在大量的空间浪费。而完全二叉树更适合使用顺序结构存储。现实中我们通常把堆(一种二叉树)使用顺序结构的数组来存储,需要注意的是这里的堆和操作系统虚拟进程地址空间中的堆是两回事,一个是数据结构,一个是操作系统中管理内存的一块区域分段。
在学习二叉树的基本操作前,需先要创建一棵二叉树,然后才能学习其相关的基本操作。由于现在我们对二叉树结构掌握还不够深入,为了降低大家学习难度,此处我会手动快速创建一棵简单的二叉树,先快速进入二叉树操作学习,等二叉树结构了解的差不多时,再反过头来研究二叉树真正的创建方式。
typedef int BTDataType;
typedef struct BinaryTreeNode
{
BTDataType _data;
struct BinaryTreeNode* _left;
struct BinaryTreeNode* _right;
}BTNode;
BTNode* CreatBinaryTree()
{
BTNode* node1 = BuyNode(1);
BTNode* node2 = BuyNode(2);
BTNode* node3 = BuyNode(3);
BTNode* node4 = BuyNode(4);
BTNode* node5 = BuyNode(5);
BTNode* node6 = BuyNode(6);
node1->_left = node2;
node1->_right = node4;
node2->_left = node3;
node4->_left = node5;
node4->_right = node6;
return node1;
}
注意:上述代码并不是创建二叉树的方式,真正创建二叉树方式后序会介绍。
再看二叉树基本操作前,再回顾下二叉树的概念,二叉树的结点是:
上面的代码搓出来的二叉树是这个样子的:
从概念中可以看出,二叉树定义是递归式的,因此后序基本操作中基本都是按照该概念实现的。
学习二叉树结构,最简单的方式就是遍历。所谓二叉树遍历(Traversal)是按照某种特定的规则,依次对二叉树中的节点进行相应的操作,并且每个节点只操作一次。访问结点所做的操作依赖于具体的应用问题。 遍历是二叉树上最重要的运算之一,也是二叉树上进行其它运算的基础。
按照规则,二叉树的遍历有:前序/中序/后序的递归结构遍历:
由于被访问的结点必是某子树的根,所以N(Node)、L(Left subtree)和R(Right subtree)又可解释为根、根的左子树和根的右子树。NLR、LNR和LRN分别又称为先根遍历、中根遍历和后根遍历。
讲讲递归遍历的代码是怎么写的,先说一个前序遍历,这个懂了中后序就都懂了:
首先给你一棵树,你想要遍历打印这棵树,前序的话,就是先打印根节点的值,再打印左子树的值,最后打印右子树的值。这是对于根节点来说的,那么当你想要打印左子树的值的时候,进入到左子树的视角当中,那么左子树又变成了根,从而又出现了新的左右子树,如此循环往复,直到当访问到的某一个节点为空的时候,这时候就不需要再继续打印了。
上面这棵树先序遍历的话就是ABD###CE##F## (#代表空)
以这棵手搓出来的序列就是123###45##6## (不统计空的话就是123456)
代码实现:
// 二叉树前序遍历
void PreOrder(BTNode* root)
{
if (root == NULL)
return;
printf("%d ", root->_data);
PreOrder(root->_left);
PreOrder(root->_right);
}
中序和后续类似:
// 二叉树中序遍历
void InOrder(BTNode* root)
{
if (root == NULL)
return;
PreOrder(root->_left);
printf("%d ", root->_data);
PreOrder(root->_right);
}
// 二叉树后序遍历
void PostOrder(BTNode* root)
{
if (root == NULL)
return;
PreOrder(root->_left);
PreOrder(root->_right);
printf("%d ", root->_data);
}
前序遍历结果:1 2 3 4 5 6
中序遍历结果:3 2 1 5 4 6
后序遍历结果:3 2 5 6 4 1
层序遍历:除了先序遍历、中序遍历、后序遍历外,还可以对二叉树进行层序遍历。设二叉树的根节点所在层数为1,层序遍历就是从所在二叉树的根节点出发,首先访问第一层的树根节点,然后从左到右访问第2层上的节点,接着是第三层的节点,以此类推,自上而下,自左至右逐层访问树的结点的过程就是层序遍历。
这个层序遍历的结果就是ABCDEFGHI
其实实现起来还是有难度的,首先我们要用到队列来实现层序遍历,怎么搞呢。
代码实现:
// 层序遍历
void LevelOrder(BTNode* root)
{
if (root == NULL)
return;
Queue q;
QueueInit(&q);
QueuePush(&q, root);
while (!QueueEmpty(&q))
{
BTNode* tmp = QueueFront(&q);
printf("%d ", tmp->_data);
if (tmp->_left)
QueuePush(&q, tmp->_left);
if (tmp->_right)
QueuePush(&q, tmp->_right);
QueuePop(&q);
}
printf("\n");
QueueDestroy(&q);
}
来几道题检测一下自己的学习成果吧: