树与树算法
树的概念
树(英语:tree)是一种抽象数据类型(ADT)或是实作这种抽象数据类型的数据结构,用来模拟具有树状结构性质的数据集合。它是由n(n>=1)个有限节点组成一个具有层次关系的集合。把它叫做“树”是因为它看起来像一棵倒挂的树,也就是说它是根朝上,而叶朝下的。它具有以下的特点:
- 每个节点有零个或多个子节点;
- 没有父节点的节点称为根节点;
- 每一个非根节点有且只有一个父节点;
-
除了根节点外,每个子节点可以分为多个不相交的子树;
比如说:
树的术语
- 节点的度:一个节点含有的子树的个数称为该节点的度;(这个节点有几个下级,比如B有三个)
- 树的度:一棵树中,最大的节点的度称为树的度;(这里B的节点的度是3是最大的因此这颗树的度就是3)
- 叶节点或终端节点:度为零的节点;
- 父亲节点或父节点:若一个节点含有子节点,则这个节点称为其子节点的父节点;
- 孩子节点或子节点:一个节点含有的子树的根节点称为该节点的子节点;
- 兄弟节点:具有相同父节点的节点互称为兄弟节点;
- 节点的层次:从根开始定义起,根为第1层,根的子节点为第2层,以此类推;(B是第二层,K是第五层)
- 树的高度或深度:树中节点的最大层次;(上面这棵树有5层,树的深度是5)
- 堂兄弟节点:父节点在同一层的节点互为堂兄弟;
- 节点的祖先:从根到该节点所经分支上的所有节点;
- 子孙:以某节点为根的子树中任一节点都称为该节点的子孙。
- 森林:由m(m>=0)棵互不相交的树的集合称为森林;
树的种类
- 无序树:树中任意节点的子节点之间没有顺序关系,这种树称为无序树,也称为自由树;
- 有序树:树中任意节点的子节点之间有顺序关系,这种树称为有序树;
- 二叉树:每个节点最多含有两个子树的树称为二叉树;
- 完全二叉树:对于一颗二叉树,假设其深度为d(d>1)。除了第d层外,其它各层的节点数目均已达最大值,且第d层所有节点从左向右连续地紧密排列,这样的二叉树被称为完* * 全二叉树,其中满二叉树的定义是所有叶节点都在最底层的完全二叉树;
- 平衡二叉树(AVL树):当且仅当任何节点的两棵子树的高度差不大于1的二叉树;
- 排序二叉树(二叉查找树(英语:Binary Search Tree),也称二叉搜索树、有序二叉树);
- 霍夫曼树(用于信息编码):带权路径最短的二叉树称为哈夫曼树或最优二叉树;
- B树:一种对读写操作进行优化的自平衡的二叉查找树,能够保持数据有序,拥有多余两个子树。
划掉画红圈位置的树,这棵树就不是平衡二叉树了,原因是B的左边的子树的高度为2,右边的子树高度为0,那么相差超过了1就不是平衡二叉树
二叉排序树或者是一棵空树,或者是具有下列性质的二叉树:
(1)若左子树不空,则左子树上所有节点的值均小于它的根节点的值;
(2)若右子树不空,则右子树上所有节点的值均大于它的根节点的值;
(3)左、右子树也分别为二叉排序树;
(4)没有键值相等的节点。
树的存储与表示
-
顺序存储:将数据结构存储在固定的数组中,然在遍历速度上有一定的优势,但因所占空间比较大,是非主流二叉树。二叉树通常以链式存储。
-
链式存储:
由于对节点的个数无法掌握,常见树的存储表示都转换成二叉树进行处理,子节点个数最多为2
常见的一些树的应用场景
- 1.xml,html等,那么编写这些东西的解析器的时候,不可避免用到树
- 2.路由协议就是使用了树的算法
- 3.mysql数据库索引
- 4.文件系统的目录结构
-
5.所以很多经典的AI算法其实都是树搜索,此外机器学习中的decision tree也是树结构
二叉树
二叉树的基本概念
二叉树是每个节点最多有两个子树的树结构。通常子树被称作“左子树”(left subtree)和“右子树”(right subtree)
二叉树的性质(特性)
- 性质1: 在二叉树的第层上至多有个结点()
- 性质2: 深度为的二叉树至多有个结点()
- 性质3: 对于任意一棵二叉树,如果其叶结点数为N0,而度数为2的结点总数为N2,则N0=N2+1;
- 性质4:具有个结点的完全二叉树的深度必为
- 性质5:对完全二叉树,若从上至下、从左至右编号,则编号为i 的结点,其左孩子编号必为,其右孩子编号必为;其双亲的编号必为(时为根,除外)
(1)完全二叉树——若设二叉树的高度为h,除第 h 层外,其它各层 (1~h-1) 的结点数都达到最大个数,第h层有叶子结点,并且叶子结点都是从左到右依次排布,这就是完全二叉树。
(2)满二叉树——除了叶结点外每一个结点都有左右子叶且叶子结点都处在最底层的二叉树。
二叉树的节点表示以及树的创建
通过使用Node类中定义三个属性,分别为elem本身的值,还有lchild左孩子和rchild右孩子
class Node(object):
"""节点类"""
def __init__(self, elem=-1, lchild=None, rchild=None):
self.elem = elem #需要存储的数据.需要两个后继节点
self.lchild = lchild
self.rchild = rchild
#树的创建,创建一个树的类,并给一个root根节点,一开始为空,随后添加节点
class Tree(object):
"""树类"""
def __init__(self, root=None):
self.root = root #初始化一个树(默认是空)
def add(self, elem):
"""为树添加节点"""
node = Node(elem) #首先生成一个节点(默认的elem=-1)
#如果树是空的,则对根节点赋值
if self.root == None:
self.root = node
else: #如果树不是空的,那么就按照顺序搜索对左子树右子树进行赋值
queue = [] #首先建立一个空的队列
queue.append(self.root) #将存在的根节点进队列
#对已有的节点进行层次遍历
while queue: #这里使用循环是因为,后面还会有左右节点进队列
#弹出队列的第一个元素
cur = queue.pop(0) #假设这个是根节点的话,使用指针弹出根节点,然后看这个根节点的左右节点
if cur.lchild == None: #如果这个根节点的左节点为空将节点挂在这个根节点的左节点上
cur.lchild = node
return
elif cur.rchild == None:
cur.rchild = node
return
else:
#如果左右子树都不为空,加入队列继续判断(将这个根节点的左右节点加入队列作为根节点继续遍历)
queue.append(cur.lchild) #先进先出,从左到右
queue.append(cur.rchild)
二叉树的遍历
树的遍历是树的一种重要的运算。所谓遍历是指对树中所有结点的信息的访问,即依次对树中每个结点访问一次且仅访问一次,我们把这种对所有节点的访问称为遍历(traversal)。那么树的两种重要的遍历模式是深度优先遍历和广度优先遍历,深度优先一般用递归,广度优先一般用队列。一般情况下能用递归实现的算法大部分也能用堆栈来实现。
深度优先遍历
对于一颗二叉树,深度优先搜索(Depth First Search)是沿着树的深度遍历树的节点,尽可能深的搜索树的分支。
那么深度遍历有重要的三种方法。这三种方式常被用于访问树的节点,它们之间的不同在于访问每个节点的次序不同。这三种遍历分别叫做先序遍历(preorder),中序遍历(inorder)和后序遍历(postorder)。我们来给出它们的详细定义,然后举例看看它们的应用。
-
先序遍历 在先序遍历中,我们先访问根节点,然后递归使用先序遍历访问左子树,再递归使用先序遍历访问右子树
根节点->左子树->右子树
def preorder(self, root): #遍历树首先传入的就是根节点
"""递归实现先序遍历"""
if root == None: #遍历结束的条件
return
print (root.elem) #打印当前节点的元素(根)
self.preorder(root.lchild) #遍历左半部分(左) #每次都当做一个新的子树
self.preorder(root.rchild) #遍历有半部分(右)
例子:
# -*- coding: utf-8 -*-
"""
Created on Sun Jun 2 19:00:11 2019
@author: zangz
"""
class Node(object):
"""节点类"""
def __init__(self, elem=-1, lchild=None, rchild=None):
self.elem = elem #存储的数据
self.lchild = lchild
self.rchild = rchild
#树的创建,创建一个树的类,并给一个root根节点,一开始为空,随后添加节点
class Tree(object):
"""树类"""
def __init__(self, root=None):
self.root = root #初始化一个树(默认是空)
def add(self, elem):
"""为树添加节点"""
node = Node(elem) #首先生成一个节点(默认的elem=-1)
#如果树是空的,则对根节点赋值
if self.root == None:
self.root = node
else: #如果树不是空的,那么就按照顺序搜索对左子树右子树进行赋值
queue = [] #首先建立一个空的队列
queue.append(self.root) #将存在的根节点进队列
#对已有的节点进行层次遍历
while queue: #这里使用循环是因为,后面还会有左右节点进队列
#弹出队列的第一个元素
cur = queue.pop(0) #假设这个是根节点的话,使用指针弹出根节点,然后看这个根节点的左右节点
if cur.lchild == None: #如果这个根节点的左节点为空将节点挂在这个根节点的左节点上
cur.lchild = node
return
elif cur.rchild == None:
cur.rchild = node
return
else:
#如果左右子树都不为空,加入队列继续判断(将这个根节点的左右节点加入队列作为根节点继续遍历)
queue.append(cur.lchild) #先进先出,从左到右
queue.append(cur.rchild)
def breadth_travel(self):
"""利用队列实现树的层次遍历(广度优先遍历)"""
if self.root == None: #如果是空就直接返回
return
queue = [] #不为空进行遍历
queue.append(self.root) #首先添加node节点
while queue: #添加完再循环取出新的节点进行打印
node = queue.pop(0) #弹出节点
print (node.elem) #打印这个节点的值
if node.lchild != None: #如果这个节点的左孩子存在,就把这左孩子追加到队列中
queue.append(node.lchild)
if node.rchild != None:
queue.append(node.rchild)
def preorder(self, root): #遍历树首先传入的就是根节点
"""递归实现先序遍历"""
if root == None: #遍历结束的条件
return
print (root.elem) #打印当前节点的元素(根)
self.preorder(root.lchild) #遍历左半部分(左) #每次都当做一个新的子树
self.preorder(root.rchild) #遍历有半部分(右)
if __name__ == '__main__':
tree=Tree() #实例化一棵树
tree.add(0)
tree.add(1)
tree.add(2)
tree.add(3)
tree.add(4)
tree.add(5)
tree.add(6)
tree.add(7)
tree.add(8)
tree.add(9)
print("层次遍历")
tree.breadth_travel()
print('先序遍历')
tree.preorder(tree.root) #首先传递的是根节点
执行结果:
层次遍历
0
1
2
3
4
5
6
7
8
9
先序遍历
0
1
3
7
8
4
9
2
5
6
-
中序遍历 在中序遍历中,我们递归使用中序遍历访问左子树,然后访问根节点,最后再递归使用中序遍历访问右子树
左子树->根节点->右子树
def inorder(self, root): #首先传入的是根节点
#中序遍历
if root == None:
return
self.inorder(root.lchild) #左子树(递归打印) #最终顺序就是左根右
print (root.elem) #根节点
self.inorder(root.rchild) #右子树(递归打印)
-
后序遍历 在后序遍历中,我们先递归使用后序遍历访问左子树和右子树,最后访问根节点
左子树->右子树->根节点
def postorder(self, root):
"""递归实现后续遍历"""
if root == None:
return
self.postorder(root.lchild) #左
self.postorder(root.rchild) #右
print (root.elem) #根
课堂练习: 按照如图树的结构写出三种遍历的顺序:
结果:
先序:a b c d e f g h
中序:b d c e a f h g
后序:d e c b h g f a
思考:哪两种遍历方式能够唯一的确定一颗树???(先中)(中后)
广度优先遍历(层次遍历)
从树的root开始,从上到下从从左到右遍历整个树的节点
def breadth_travel(self): #这个是属于树这个类的
"""利用队列实现树的层次遍历(广度优先遍历)"""
if self.root == None: #如果是空就直接返回
return
queue = [] #不为空进行遍历
queue.append(self.root) #首先添加node节点
while queue: #添加完再循环取出新的节点进行打印
node = queue.pop(0) #弹出节点
print (node.elem) #打印这个节点的值
if node.lchild != None: #如果这个节点的左孩子存在,就把这左孩子追加到队列中
queue.append(node.lchild)
if node.rchild != None:
queue.append(node.rchild)
例子:
# -*- coding: utf-8 -*-
"""
Created on Sun Jun 2 19:00:11 2019
@author: zangz
"""
class Node(object):
"""节点类"""
def __init__(self, elem=-1, lchild=None, rchild=None):
self.elem = elem #存储的数据
self.lchild = lchild
self.rchild = rchild
#树的创建,创建一个树的类,并给一个root根节点,一开始为空,随后添加节点
class Tree(object):
"""树类"""
def __init__(self, root=None):
self.root = root #初始化一个树(默认是空)
def add(self, elem):
"""为树添加节点"""
node = Node(elem) #首先生成一个节点(默认的elem=-1)
#如果树是空的,则对根节点赋值
if self.root == None:
self.root = node
else: #如果树不是空的,那么就按照顺序搜索对左子树右子树进行赋值
queue = [] #首先建立一个空的队列
queue.append(self.root) #将存在的根节点进队列
#对已有的节点进行层次遍历
while queue: #这里使用循环是因为,后面还会有左右节点进队列
#弹出队列的第一个元素
cur = queue.pop(0) #假设这个是根节点的话,使用指针弹出根节点,然后看这个根节点的左右节点
if cur.lchild == None: #如果这个根节点的左节点为空将节点挂在这个根节点的左节点上
cur.lchild = node
return
elif cur.rchild == None:
cur.rchild = node
return
else:
#如果左右子树都不为空,加入队列继续判断(将这个根节点的左右节点加入队列作为根节点继续遍历)
queue.append(cur.lchild) #先进先出,从左到右
queue.append(cur.rchild)
def breadth_travel(self):
"""利用队列实现树的层次遍历(广度优先遍历)"""
if self.root == None: #如果是空就直接返回
return
queue = [] #不为空进行遍历
queue.append(self.root) #首先添加node节点
while queue: #添加完再循环取出新的节点进行打印
node = queue.pop(0) #弹出节点
print (node.elem) #打印这个节点的值
if node.lchild != None: #如果这个节点的左孩子存在,就把这左孩子追加到队列中
queue.append(node.lchild)
if node.rchild != None:
queue.append(node.rchild)
if __name__ == '__main__':
tree=Tree() #实例化一棵树
tree.add(1)
tree.add(2)
tree.add(3)
tree.add(4)
tree.add(5)
tree.breadth_travel()
执行结果:
1
2
3
4
5
完成的各种遍历的实例:
# -*- coding: utf-8 -*-
"""
Created on Sun Jun 2 19:00:11 2019
@author: zangz
"""
class Node(object):
"""节点类"""
def __init__(self, elem=-1, lchild=None, rchild=None):
self.elem = elem #存储的数据
self.lchild = lchild
self.rchild = rchild
#树的创建,创建一个树的类,并给一个root根节点,一开始为空,随后添加节点
class Tree(object):
"""树类"""
def __init__(self, root=None):
self.root = root #初始化一个树(默认是空)
def add(self, elem):
"""为树添加节点"""
node = Node(elem) #首先生成一个节点(默认的elem=-1)
#如果树是空的,则对根节点赋值
if self.root == None:
self.root = node
else: #如果树不是空的,那么就按照顺序搜索对左子树右子树进行赋值
queue = [] #首先建立一个空的队列
queue.append(self.root) #将存在的根节点进队列
#对已有的节点进行层次遍历
while queue: #这里使用循环是因为,后面还会有左右节点进队列
#弹出队列的第一个元素
cur = queue.pop(0) #假设这个是根节点的话,使用指针弹出根节点,然后看这个根节点的左右节点
if cur.lchild == None: #如果这个根节点的左节点为空将节点挂在这个根节点的左节点上
cur.lchild = node
return
elif cur.rchild == None:
cur.rchild = node
return
else:
#如果左右子树都不为空,加入队列继续判断(将这个根节点的左右节点加入队列作为根节点继续遍历)
queue.append(cur.lchild) #先进先出,从左到右
queue.append(cur.rchild)
def breadth_travel(self):
"""利用队列实现树的层次遍历(广度优先遍历)"""
if self.root == None: #如果是空就直接返回
return
queue = [] #不为空进行遍历
queue.append(self.root) #首先添加node节点
while queue: #添加完再循环取出新的节点进行打印
node = queue.pop(0) #弹出节点
print (node.elem) #打印这个节点的值
if node.lchild != None: #如果这个节点的左孩子存在,就把这左孩子追加到队列中
queue.append(node.lchild)
if node.rchild != None:
queue.append(node.rchild)
def preorder(self, root): #遍历树首先传入的就是根节点
"""递归实现先序遍历"""
if root == None: #遍历结束的条件
return
print (root.elem) #打印当前节点的元素(根)
self.preorder(root.lchild) #遍历左半部分(左) #每次都当做一个新的子树
self.preorder(root.rchild) #遍历有半部分(右)
def inorder(self, root): #首先传入的是根节点
if root == None:
return
self.inorder(root.lchild) #左子树(递归打印) #最终顺序就是左根右
print (root.elem) #根节点
self.inorder(root.rchild) #右子树(递归打印)
def postorder(self, root):
"""递归实现后续遍历"""
if root == None:
return
self.postorder(root.lchild) #左
self.postorder(root.rchild) #右
print (root.elem) #根
if __name__ == '__main__':
tree=Tree() #实例化一棵树
tree.add(0)
tree.add(1)
tree.add(2)
tree.add(3)
tree.add(4)
tree.add(5)
tree.add(6)
tree.add(7)
tree.add(8)
tree.add(9)
print("层次遍历")
tree.breadth_travel()
print('先序遍历')
tree.preorder(tree.root) #首先传递的是根节点
print('中序遍历')
tree.inorder(tree.root) #首先传递的是根节点
print('后序遍历')
tree.postorder(tree.root) #首先传递的是根节点
执行结果:
层次遍历
0
1
2
3
4
5
6
7
8
9
先序遍历
0
1
3
7
8
4
9
2
5
6
中序遍历
7
3
8
1
9
4
0
5
2
6
后序遍历
7
8
3
9
4
1
5
6
2
0