重学数据结构之树和二叉树

一、树和森林

1.基本概念

  树状图(Tree)又称为树,是一种复杂的数据结构。树是由 n(n>=0)个有限节点组成一个具有层次关系的集合,把它叫做“树”是因为它看起来像一棵倒挂的树,也就是说它是根朝上,而叶朝下的。当 n=0 时,称之为空树,否则是非空树。

  树具有以下的特点:

  • 每个节点有零个或多个子节点;
  • 没有父节点的节点称为根节点;
  • 每一个非根节点有且只有一个父节点;
  • 除了根节点外,每个子节点可以分为多个不相交的子树。

2.基本术语

  子女:若节点的子树非空,则节点子树的根即为该节点的子女。

  双亲:若节点有子女,则该节点即为子女的双亲。

  兄弟:同一节点的子女互称为兄弟。

  :节点的子女个数即为该节点的度。

  分支节点:度不为0的节点即为分支节点。

  叶子节点:度为0的节点即为叶子节点。

  深度:节点的深度即为该节点所在的层次。

  高度:规定叶子节点的高度为1,其双亲节点的高度等于它的高度加1。

  森林:森林是 m(m>=0)颗树的集合。

  

二、二叉树

1.基本概念

  一颗二叉树是节点的有限集合,该集合或者为空,或者由一个根节点和两颗分别称为左子树和右子树的、互不交叉的二叉树组成(子树有左右之分,不可颠倒)。下面是二叉树的五种形态:

  重学数据结构之树和二叉树_第1张图片

2.基本性质

  性质1:若二叉树节点的层次从1开始,则在二叉树的第 i 层最多有 2i-1 个节点(i>=1)。

  性质2:深度为 k 的二叉树最少有 k 个节点,最多有 2k-1个 节点(k>=1)。

  性质3:对任意一颗二叉树,如果其叶子节点有 m 个,度为2的非叶子节点为 n 个,则有:m = n + 1。

  设度为1的节点有 p 个,总节点数为 x,总边数为 e,则 x = m + n + p,e  = n - 1 = 2 * n + p。因此有:

2 * n + p = m + n + p - 1

n = m - 1

m = n + 1

3.满二叉树和完全二叉树

1)满二叉树:除了最后一层无任何子节点,每一层的所有节点都有两个子节点,即除了叶子节点外的所有节点均有两个子节点,这样的二叉树就称为满二叉树。

2)完全二叉树:设一个二叉树的深度为 k,即共有 k 层。除了第 k 层外,其他各层的节点数都达到最大个数,且最后一层上只缺少右边的若干节点,这样的二叉树就称为完全二叉树。

4.Python 实现

   下面是用 Python 实现的一个二叉树的代码,除了实现创建二叉树,还实现了四种遍历二叉树的方法,分别是:前序遍历、中序遍历、后序遍历和层次遍历。

  1 # 自定义树节点
  2 class Node:
  3     def __init__(self, value=None, left=None, right=None):
  4         self.value = value
  5         self.left = left
  6         self.right = right
  7 
  8 
  9 # 自定义二叉树
 10 class BinaryTree: 11 def __init__(self, value=None, left=None, right=None): 12 """ 13 根据传入的参数决定树的形态 14 :param value: 节点值 15 :param left: 左子树 16 :param right: 右子树 17 """ 18 self.root = Node(value, left, right) if value else None 19 20 def is_empty(self): 21 """ 22 判断是否为空树 23 :return: 24 """ 25 return True if self.root else False 26 27 def get_root(self): 28 """ 29 获取根节点 30 :return: 31 """ 32 return self.root 33 34 def get_left(self): 35 """ 36 获取左子树 37 :return: 38 """ 39 return self.root.left if self.root else None 40 41 def get_right(self): 42 """ 43 获取右子树 44 :return: 45 """ 46 return self.root.right if self.root else None 47 48 def set_left(self, node: Node): 49 """ 50 设置左子树 51 :param node: 树节点 52 :return: 53 """ 54 self.root.left = node 55 56 def set_right(self, node: Node): 57 """ 58 设置右子树 59 :param node: 树节点 60 :return: 61 """ 62 self.root.right = node 63 64 def pre_traverse(self, node: Node): 65 """ 66 前序遍历 67 :param node: 根节点 68 :return: 69 """ 70 if not node: 71 return 72 print(node.value, end=" ") 73  self.pre_traverse(node.left) 74  self.pre_traverse(node.right) 75 76 def mid_traverse(self, node: Node): 77 """ 78 中序遍历 79 :param node: 根节点 80 :return: 81 """ 82 if not node: 83 return 84  self.mid_traverse(node.left) 85 print(node.value, end=" ") 86  self.mid_traverse(node.right) 87 88 def after_traverse(self, node: Node): 89 """ 90 后序遍历 91 :param node: 根节点 92 :return: 93 """ 94 if not node: 95 return 96  self.after_traverse(node.left) 97  self.after_traverse(node.right) 98 print(node.value, end=" ") 99 100 def level_traverse(self, nodes: list): 101 next_nodes = [] 102 if nodes: 103 for node in nodes: 104 print(node.value, end=" ") 105 if node.left: 106  next_nodes.append(node.left) 107 if node.right: 108  next_nodes.append(node.right) 109 self.level_traverse(next_nodes)

  当然光有这些方法还是不够的,因为要一个个的创建节点还是很麻烦,我们可以将一个树节点定义成一个三元组:

(树节点的值,左子树,右子树)

  而左子树和右子树也都可以用这种三元组来表示,例如下面是一颗二叉树的三元组表示:

(F, (C, A, (D, B, None)), (E, H, (G, M, None)))   

  重学数据结构之树和二叉树_第2张图片

  因此还需要实现一个将这种三元组表达形式转换成二叉树的方法:

 1     def create(self, data: tuple):
 2         """
 3         创建一个二叉树
 4         :param data: 例如(1,(2,4,5),(3,6,7))
 5         """
 6         self.root = self.parse(data)
 7 
 8     def parse(self, data: tuple):
 9         """
10         解析传入的三元组,创建二叉树
11         :param data: 三元组
12         :return:
13         """
14         if data:
15             node = Node(data[0])
16             node.left = self.parse(data[1]) if type(data[1]) == tuple else Node(data[1]) 17 node.right = self.parse(data[2]) if type(data[2]) == tuple else Node(data[2]) 18 return node

 

三、树的应用

1.表达式计算问题

1)问题描述

  一个结构正确的二元表达式对应于一个满二叉树,例如下面这样一颗二叉树:

  重学数据结构之树和二叉树_第3张图片

 

  这样一颗二叉树前序遍历得到“-+1*23/45”,后序遍历得到“123*+45/-”,正是波兰表达式的形式,而其中序遍历结果就是“1+2*3-4/5”,基本就是相应数学表达式的正确形式,只是缺少了表达计算顺序的括号。输入一个简单的只包含四则运算的数学计算表达式,求出其计算后的结果。

2)问题分析

  对于任意一个二元表达式(如“a+b”)都可以用一个三元组来表示(如“('+', a, b)”),而像上面示例中的表达式,就可以用下面这种三元组表示:

("-", ("+", 1, ("*", 2, 3)), ("/", 4, 5))

  这种三元表达式都包含一个操作符设为 op,两个操作数分别为 x 和 y,因而可以写出下面的计算方法:

1 if op == "+":
2     return x + y
3 if op == "-":
4     return x - y
5 if op == "*":
6     return x * y 7 if op == "/": 8 return x / y if y else 0

  那么现在的问题就是如何将数学表达式转换成二叉树,再就根据二叉树得到三元组,最后就能使用上面的方法把表达式的值求出来了。因为我们都知道在没有括号的情况下,乘除的优先级是高于加减的,而利用二叉树求解表达式时会从下往上,从叶子节点往根节点进行计算,所以要把加减号放在上面,乘除号放在下面。

3)二叉树求解

  下面是根据输入的表达式字符串建立二叉树的具体代码:

 1 def build_tree(input_string):
 2     """
 3     根据输入的表达式字符串建立二叉树
 4     :param input_string: 输入表达式
 5     :return:
 6     """
 7     if "+" in input_string or "-" in input_string:
 8         for i in range(len(input_string)):
 9             if input_string[i] in ["+", "-"] and "+" not in input_string[i + 1:] and "-" not in input_string[i + 1:]:
10                 node = Node(input_string[i], build_tree(input_string[:i]), build_tree(input_string[i + 1:]))
11                 return node 12 elif "*" in input_string or "/" in input_string: 13 for i in range(len(input_string)): 14 if input_string[i] in ["*", "/"]: 15 node = Node(input_string[i], build_tree(input_string[:i]), build_tree(input_string[i + 1:])) 16 return node 17 else: 18 return Node(input_string)

  在生成二叉树之后,还要根据这个二叉树得到三元组,下面就是使用递归算法得到三元组的代码:

 1 def trans(self, node: Node, data: tuple):
 2     """
 3     将二叉树转换成三元组
 4     :param node: 节点
 5     :param data: 三元组
 6     :return:
 7     """
 8     left = self.trans(node.left, data) if node.left.left else node.left.value
 9     right = self.trans(node.right, data) if node.right.left else node.right.value
10     data = (node.value, left, right)
11     return data

  现在已经能生成二叉树并得到表达式的三元组了,再就是求值了,下面是使用递归算法计算三元表达式的值的代码:

 1 def solution(e):
 2     """
 3     计算表达式的值
 4     :param e: 转化成三元组表达的计算表达式
 5     :return:
 6     """
 7     if type(e) == tuple:
 8         op, a, b = e[0], solution(e[1]), solution(e[2])
 9         x, y = float(a), float(b)
10         if op == "+":
11             return x + y 12 if op == "-": 13 return x - y 14 if op == "*": 15 return x * y 16 if op == "/": 17 return x / y if y else 0 18 else: 19 return e

  求解计算表达式的代码已经完成了,下面是使用这些代码来求"1+2*3-4/5"的代码示例:

1 s = build_tree("1+2*3-4/5")
2 tree = Tree()
3 tree.root = s
4 exp = tree.trans(s, ())
5 print(solution(exp))
6 # 6.2

你可能感兴趣的:(重学数据结构之树和二叉树)