.滄海难为水

【数据结构】二叉树

树概念及结构

树的概念

树是一种非线性的数据结构，它是由n（n>=0）个有限结点组成一个具有层次关系的集合。把它叫做树是因为它看起来像一棵倒挂的树，也就是说它是根朝上，而叶朝下的。

有一个特殊的结点，称为根结点，根节点没有前驱结点
除根节点外，其余结点被分成M(M>0)个互不相交的集合T1、T2、……、Tm，其中每一个集合Ti(1<= i<= m)又是一棵结构与树类似的子树。每棵子树的根结点有且只有一个前驱，可以有0个或多个后继。
因此，树是递归定义的。

注意：树形结构中，子树之间不能有交集，否则就不是树形结构。

树的相关概念

节点的度：一个节点含有的子树的个数称为该节点的度；如上图：A的为6 。
叶节点或终端节点：度为0的节点称为叶节点；如上图：B、C、H、I…等节点为叶节点非终端节点或分支节点：度不为0的节点；如上图：D、E、F、G…等节点为分支节点。
双亲节点或父节点：若一个节点含有子节点，则这个节点称为其子节点的父节点；如上图：A是B的父节点。
孩子节点或子节点：一个节点含有的子树的根节点称为该节点的子节点；如上图：B是A的孩子节点。
兄弟节点：具有相同父节点的节点互称为兄弟节点；如上图：B、C是兄弟节点。
树的度：一棵树中，最大的节点的度称为树的度；如上图：树的度为6。
节点的层次：从根开始定义起，根为第1层，根的子节点为第2层，以此类推。
树的高度或深度：树中节点的最大层次；如上图：树的高度为4。
堂兄弟节点：双亲在同一层的节点互为堂兄弟；如上图：H、I互为兄弟节点。
节点的祖先：从根到该节点所经分支上的所有节点；如上图：A是所有节点的祖先。
子孙：以某节点为根的子树中任一节点都称为该节点的子孙。如上图：所有节点都是A的子孙。
森林：由m（m>0）棵互不相交的树的集合称为森林。

树的表示

树结构相对线性表就比较复杂了，要存储表示起来就比较麻烦了，既然保存值域，也要保存结点和结点之间的关系，实际中树有很多种表示方式如：双亲表示法，孩子表示法、孩子双亲表示法以及孩子兄弟表示法等。我们这里就简单的了解其中最常用的孩子兄弟表示法。

typedef int DataType;
struct Node
{
	struct Node* _firstChild1; // 第一个孩子结点
	struct Node* _pNextBrother; // 指向其下一个兄弟结点
	DataType _data; // 结点中的数据域
};

树在实际中的运用（表示文件系统的目录树结构）

我们电脑中的文件都是以树的结构为基础进行存储的：

二叉树概念及结构

概念

一棵二叉树是结点的一个有限集合，该集合：

为空。
由一个根节点加上两棵别称为左子树和右子树的二叉树组成。

从上图可以看出：

二叉树不存在度大于2的结点。
二叉树的子树有左右之分，次序不能颠倒，因此二叉树是有序树。

注意：对于任意的二叉树都是由以下几种情况复合而成的：

特殊的二叉树

满二叉树：一个二叉树，如果每一个层的结点数都达到最大值，则这个二叉树就是满二叉树。也就是说，如果一个二叉树的层数为K，且结点总数是 2^K - 1，则它就是满二叉树。
完全二叉树：完全二叉树是效率很高的数据结构，完全二叉树是由满二叉树而引出来的。对于深度为K的，有n个结点的二叉树，当且仅当其每一个结点都与深度为K的满二叉树中编号从1至n的结点一一对应时称之为完全二叉树。要注意的是满二叉树是一种特殊的完全二叉树。

二叉树的性质

若规定根节点的层数为1，则一棵非空二叉树的第i层上最多有 2^(i-1) 个结点。
若规定根节点的层数为1，则深度为h的二叉树的最大结点数是 2^h - 1。
对任何一棵二叉树, 如果度为0其叶结点个数为n0 ，度为2的分支结点个数为n2 ，则有 n0 = n2 + 1。
若规定根节点的层数为1，具有n个结点的满二叉树的深度，h=log2(n + 1) 。 (ps：是log以2为底，n+1为对数)
对于具有n个结点的完全二叉树，如果按照从上至下从左至右的数组顺序对所有节点从0开始编号，则对于序号为i的结点有：
- 若i>0，i位置节点的双亲序号：(i-1)/2；i=0，i为根节点编号，无双亲节点。
- 若2i+1=n否则无左孩子。
- 若2i+2=n否则无右孩子。

下面有几道题来帮助大家理解二叉树的性质：

1… 某二叉树共有 399 个结点，其中有 199 个度为 2 的结点，则该二叉树中的叶子结点数为（ B ）
A 不存在这样的二叉树
B 200
C 198
D 199
2. 下列数据结构中，不适合采用顺序存储结构的是（ A ）
A 非完全二叉树
B 堆(类似于完全二叉树)
C 队列
D 栈
3. 在具有 2n 个结点的完全二叉树中，叶子结点个数为（ A ）
A n
B n+1
C n-1
D n/2
4. 一棵完全二叉树的节点数位为531个，那么这棵树的高度为（ B ）
A 11
B 10
C 8
D 12
5. 一个具有767个节点的完全二叉树，其叶子节点个数为（ B ）
A 383
B 384
C 385
D 386

二叉树的存储结构

二叉树一般可以使用两种结构存储，一种顺序结构，一种链式结构。

顺序存储：顺序结构存储就是使用数组来存储，一般使用数组只适合表示完全二叉树，因为不是完全二叉树会有空间的浪费。而现实中使用中只有堆才会使用数组来存储，关于堆我们后面的章节会专门讲解。二叉树顺序存储在物理上是一个数组，在逻辑上是一颗二叉树。

链式存储：二叉树的链式存储结构是指，用链表来表示一棵二叉树，即用链来指示元素的逻辑关系。通常的方法是链表中每个结点由三个域组成，数据域和左右指针域，左右指针分别用来给出该结点左孩子和右孩子所在的链结点的存储地址。链式结构又分为二叉链和三叉链，当前我们碰到的一般都是二叉链，红黑树等一些结构会用到三叉链。

typedef int BTDataType;
// 二叉链
struct BinaryTreeNode
{
    struct BinTreeNode* _pLeft; // 指向当前节点左孩子
    struct BinTreeNode* _pRight; // 指向当前节点右孩子
    BTDataType _data; // 当前节点值域
}
// 三叉链
struct BinaryTreeNode
{
    struct BinTreeNode* _pParent; // 指向当前节点的双亲
    struct BinTreeNode* _pLeft; // 指向当前节点左孩子
    struct BinTreeNode* _pRight; // 指向当前节点右孩子
    BTDataType _data; // 当前节点值域
}；

二叉树的顺序结构及实现

二叉树的顺序结构

普通的二叉树是不适合用数组来存储的，因为可能会存在大量的空间浪费。而完全二叉树更适合使用顺序结构存储。现实中我们通常把堆(一种二叉树)使用顺序结构的数组来存储，需要注意的是这里的堆和操作系统虚拟进程地址空间中的堆是两回事，一个是数据结构，一个是操作系统中管理内存的一块区域分段。

二叉树链式结构的实现

前置说明

在学习二叉树的基本操作前，需先要创建一棵二叉树，然后才能学习其相关的基本操作。由于现在我们对二叉树结构掌握还不够深入，为了降低大家学习难度，此处我会手动快速创建一棵简单的二叉树，先快速进入二叉树操作学习，等二叉树结构了解的差不多时，再反过头来研究二叉树真正的创建方式。

typedef int BTDataType;

typedef struct BinaryTreeNode
{
	BTDataType _data;
	struct BinaryTreeNode* _left;
	struct BinaryTreeNode* _right;
}BTNode;

BTNode* CreatBinaryTree()
{
	BTNode* node1 = BuyNode(1);
	BTNode* node2 = BuyNode(2);
	BTNode* node3 = BuyNode(3);
	BTNode* node4 = BuyNode(4);
	BTNode* node5 = BuyNode(5);
	BTNode* node6 = BuyNode(6);
	
	node1->_left = node2;
	node1->_right = node4;
	node2->_left = node3;
	node4->_left = node5;
	node4->_right = node6;
	return node1;
}

注意：上述代码并不是创建二叉树的方式，真正创建二叉树方式后序会介绍。
再看二叉树基本操作前，再回顾下二叉树的概念，二叉树的结点是：

为空。
由一个根节点加上两棵别称为左子树和右子树的二叉树组成。

上面的代码搓出来的二叉树是这个样子的：

从概念中可以看出，二叉树定义是递归式的，因此后序基本操作中基本都是按照该概念实现的。

二叉树的遍历

前序、中序以及后序

学习二叉树结构，最简单的方式就是遍历。所谓二叉树遍历(Traversal)是按照某种特定的规则，依次对二叉树中的节点进行相应的操作，并且每个节点只操作一次。访问结点所做的操作依赖于具体的应用问题。遍历是二叉树上最重要的运算之一，也是二叉树上进行其它运算的基础。

按照规则，二叉树的遍历有：前序/中序/后序的递归结构遍历：

前序遍历(Preorder Traversal 亦称先序遍历)——访问根结点的操作发生在遍历其左右子树之前。(根左右)
中序遍历(Inorder Traversal)——访问根结点的操作发生在遍历其左右子树之中（间）。(左根右)
后序遍历(Postorder Traversal)——访问根结点的操作发生在遍历其左右子树之后。(左右根)

由于被访问的结点必是某子树的根，所以N(Node）、L(Left subtree）和R(Right subtree）又可解释为根、根的左子树和根的右子树。NLR、LNR和LRN分别又称为先根遍历、中根遍历和后根遍历。

讲讲递归遍历的代码是怎么写的，先说一个前序遍历，这个懂了中后序就都懂了：
首先给你一棵树，你想要遍历打印这棵树，前序的话，就是先打印根节点的值，再打印左子树的值，最后打印右子树的值。这是对于根节点来说的，那么当你想要打印左子树的值的时候，进入到左子树的视角当中，那么左子树又变成了根，从而又出现了新的左右子树，如此循环往复，直到当访问到的某一个节点为空的时候，这时候就不需要再继续打印了。

上面这棵树先序遍历的话就是ABD###CE##F## (#代表空)

以这棵手搓出来的序列就是123###45##6## (不统计空的话就是123456)

代码实现：

// 二叉树前序遍历
void PreOrder(BTNode* root)
{
	if (root == NULL)
		return;

	printf("%d ", root->_data);
	PreOrder(root->_left);
	PreOrder(root->_right);
}

中序和后续类似：

// 二叉树中序遍历
void InOrder(BTNode* root)
{
	if (root == NULL)
		return;

	PreOrder(root->_left);
	printf("%d ", root->_data);
	PreOrder(root->_right);
}
// 二叉树后序遍历
void PostOrder(BTNode* root)
{
	if (root == NULL)
		return;

	PreOrder(root->_left);
	PreOrder(root->_right);
	printf("%d ", root->_data);
}

前序遍历结果：1 2 3 4 5 6
中序遍历结果：3 2 1 5 4 6
后序遍历结果：3 2 5 6 4 1

层序遍历

层序遍历：除了先序遍历、中序遍历、后序遍历外，还可以对二叉树进行层序遍历。设二叉树的根节点所在层数为1，层序遍历就是从所在二叉树的根节点出发，首先访问第一层的树根节点，然后从左到右访问第2层上的节点，接着是第三层的节点，以此类推，自上而下，自左至右逐层访问树的结点的过程就是层序遍历。

这个层序遍历的结果就是ABCDEFGHI

其实实现起来还是有难度的，首先我们要用到队列来实现层序遍历，怎么搞呢。

先判断根结点是否为空，如果根节点为空，没法遍历，就直接返回；如果不为空就先将根节点入队。然后开始循环循环条件为队列不为空。
进入循环后，先front得到队头元素（是一个结点，这里用tmp表示），然后将队头pop掉，然后将tmp的左子树（不为空的前提下）和右子树（不为空的前提下）入队，并将tmp的值打印，然后循环往复直到队列为空。