Python数据结构与算法-树

一、树的概念

详情见 https://blog.csdn.net/little_limin/article/details/129845592

Python数据结构与算法-堆排序(NB组)—— 一、树的基础知识

二、树的实例:模拟文件系统

1、树的存储

树结构也是链式存储的,与链表的结构相似,只是树存在多个子节点,不是线性的,存在一堆多的情况。与双链表相似,只不过链表节点对应的下一个节点只有一个,树节点对应的孩子节点很多,需要用列表[]存储。

(1)树节点代码实现

# 树节点的类
class Node(): # 创建文件节点的类,及其属性(父节点,孩子节点)
    def __init__(self, name, type = "dir"):  # 节点初始属性,文件名,文件类型
        self.name = name  # 文件名
        self.type = type # 文件类型
        # 文件相互间关系
        self.children = [] # 孩子节点,孩子节点可以有很多,所以是列表
        self.parent = None # 父节点,父节点只有一个的,不一定需要有这个指向

# print测试
n = Node("hello") #父节点
n2 = Node("world") #孩子节点1
n3 = Node("yoyo") # 孩子节点2
# 孩子节点与父节点关联
n.children.append(n2) 
n.children.append(n3)
n2.parent = n
n3.parent = n
# 打印孩子节点的属性
for nm in n.children:
    print(nm.name)

(2)输出结果

world
yoyo

2、模拟文件系统

(1)代码实现

# 树的实例:模拟文件系统
# 树是链式存储
class Node(): # 创建文件节点的类,及其属性(父节点,孩子节点)
    def __init__(self, name, type = "dir"):  # 节点初始属性,文件名,文件类型
        self.name = name  # 文件名
        self.type = type # 文件类型
        # 文件相互间关系
        self.children = [] # 孩子节点,孩子节点可以有很多,所以是列表
        self.parent = None # 父节点,父节点只有一个的,不一定需要有这个指向

    def __repr__(self): # 内置函数,返回值
        return self.name  # 返回名字

class FileSystemTree(): # 创建文件根目录——数据结构(树)
    def __init__(self) -> None: # 树的属性
        self.root = Node("/")  # 树的根节点,类似于链表的head结点 
        self.now = self.root # now指针,当前目录

    def mkdir(self,name):  # 当前目录创建文件
        # 保证name以/结尾
        if name[-1] != "/": # name这个字符串的最后一位不是斜杠
            name += "/"  # 在name的最后加上斜杠
        new_dir = Node(name)  # 创建文件节点
        # 创建与当前文件夹的连接
        self.now.children.append(new_dir)  
        new_dir.parent = self.now 

    def ls(self):  # 展现当前目录下的所有子目录
        return self.now.children  # 返回子目录列表
    
    def cd(self,name): # 切换目录(到子目录),支持向上返回
        # 判断是否为文件夹
        if name[-1] != "/":
            name += "/"

        if name == "../": #当前目录
            self.now = self.now.parent  # 返回目录到上级
            return
        # 找到和name相同的文件
        for child in self.now.children:
            if child.name == name: 
                self.now = child # 切换目录到child
                return  # 输出
        # 子目录中无该文件夹,报错
        raise ValueError("invaild dir")
    
tree = FileSystemTree() # 创建树

# 新建文件夹
tree.mkdir("Var/")
tree.mkdir("bin/")
tree.mkdir("usr/")
print(tree.ls()) # 展示当前子目录

# 切换到子目录
tree.cd("bin/")
tree.mkdir("python/") # 子目录中创建文件夹
print(tree.ls()) # 展示当前子目录

# 切换回上级目录
tree.cd("../")
print(tree.ls()) # 展示当前子目录

(2)代码结果

[Var/, bin/, usr/]
[python/]
[Var/, bin/, usr/]

3、模拟文件代码相关知识点

(1)__repr__ 和__str__ 内置函数的用法和示例

1)__repr__的作用

输出实例对象时,其内容由__repr__的返回值决定。

class Test:
    def __repr__(self) -> str:
        return "hello"

t = Test()
print(t)

输出结果

hello

可以看到,当打印实例对象的时候,打印的结果就是__repr__的返回值。如果不加定义__repr__则会默认使用object__repr__函数,返回如下:

<__main__.Test object at 0x0000023573CF0700>

2)__str__作用

与__repe__作用相同,只不过__str__要更猛一点,当你的类中同时重写了__str____repr__后,那么当你打印实例对象的时候,python底层会优先执行实例对象.__str__()。

class Test:
    def __repr__(self) -> str:
        return "repr"
    
    def __str__(self) -> str:
        return "str"

t = Test()
print(t)

输出结果

str

通过上面这个例子可以看到,输出的是__str__的返回值(__repr__没抢过__str__)。

(2)__str__和__repr__区别

在代码编辑器中执行print()函数,python优先调用print(实例对象.__str__());而当在运行终端直接敲实例对象的时候,python底层执行的其实是实例对象.__repr__()。

示例1:在终端直接打印

>>> from text import Test
>>> t = Test()
>>> t
repr
>>> print(t)
str

示例2:在编辑器print()

class Test:
    def __repr__(self) -> str:
        return "repr"
    
    def __str__(self) -> str:
        return "str"

t = Test()
print(t)

输出结果:

str

(3)文件的相对路径和绝对路径

相对路径从当前目录到文件所在位置;

绝对路径从根目录开始到文件所在地。

(4)python的"./"、"../"和"/"路径

  • ./代表目前文件所在的目录。

  • . ./代表目前文件的上一层目录。

  • /代表根目录。

三、二叉树

1、概念

详情见 https://blog.csdn.net/little_limin/article/details/129845592

Python数据结构与算法-堆排序(NB组)—— 二、二叉树的基础知识

2、二叉树的存储

(1)二叉树的链式存储

将二叉树的节点定义为一个对象,节点之间通过类似链表的链接方式来连接。

Python数据结构与算法-树_第1张图片

(2)节点存储代码

class BiTreeNode: # 二叉树
    def __init__(self,data): # data:节点数据
        self.data = data
        self.lchild = None # 左孩子
        self.rchild = None # 右孩子

3、二叉树代码实现

# 二叉树的简单实现

class BiTreeNode(): # 二叉树节点
    def __init__(self,data) -> None: 
        self.data = data
        self.lchild = None
        self.rchild = None

# 定位节点
a = BiTreeNode("A")
b = BiTreeNode("B")
c = BiTreeNode("C")
d = BiTreeNode("D")
e = BiTreeNode("E")
f = BiTreeNode("F")
g = BiTreeNode("G")

# 节点关系链接
e.lchild = a
e.rchild = g
a.rchild = c
c.lchild = b
c.rchild = d
g.rchild = f

# 根节点
root = e

print(root.lchild.rchild.data)

结果输出

C

4、二叉树的遍历

Python数据结构与算法-树_第2张图片

以上图举例,树的遍历如何实现。

(1)二叉树遍历方式

  • 前序遍历:EACBDGF 从根节点开始,先左孩子再右孩子。

  • 中序遍历:ABCDEFG

  • 后序遍历:BDCAFGE

  • 层次遍历:EAGCFBD

(2)前序遍历代码实现

在二叉树代码实现的基础代码上,增加以下代码,以下代码为前序遍历主代码。

# 根节点
root = e

# 前序遍历
def pre_order(root):
    if root:   # root不为空
        print(root.data, end = ',')
        pre_order(root.lchild)  # 访问左孩子
        pre_order(root.rchild)  # 访问右孩子

pre_order(e) # 从e开始前序遍历

输出结果

E,A,C,B,D,G,F,

(3)中序遍历代码实现

中序遍历可以理解为将树结构“拍扁”,与前序遍历的区别仅在print打印的位置不同。

# 中序遍历
def in_order(root):
    if root:  # root不为空,递归结束条件
        in_order(root.lchild) # 访问左孩子
        print(root.data, end = ',') # 打印本身
        in_order(root.rchild) # 访问右孩子

in_order(root) # 从e开始前序遍历

输出结果

A,B,C,D,E,G,F,

递归原理

s1.首先,运行E的左孩子所在的子树,打印E,再运行E的右孩子所在的子树。

s2.进入E的左孩子的子树,A没有左孩子,打印A,运行A的右孩子。

s3.进入A的右孩子的子树,先运行C的左孩子,打印C,运行C的右孩子。

s4.进入C的左孩子的子树,打印了B;进入C的右孩子的子树,打印了D。

s5,进入E的右孩子的子树,依旧同以上步骤,得到G和F。

Python数据结构与算法-树_第3张图片

(4)后序遍历

# 后序遍历
def post_order(root):
    if root: # root不为空,递归结束条件
        post_order(root.lchild) # 访问左孩子
        post_order(root.rchild) # 访问右孩子
        print(root.data, end = ',') # 打印本身

post_order(root) # 从e开始前序遍历

输出结果

B,D,C,A,F,G,E,

递归原理

运行的顺序从左往右,与中序遍历的原理类似。先运行左孩子所在子树,再运行右孩子所在子树,最后才打印本身。

Python数据结构与算法-树_第4张图片

(5)层次遍历

# 层次遍历——广度优先搜索
from collections import deque # 队列模块

def level_order(root):
    queue = deque() # 新建队列
    queue.append(root) # 根节点入队
    while len(queue) > 0:  # 队列不空
        node = queue.popleft() # 节点出队
        print(node.data, end = ',') # 得到节点的值
        if node.lchild: # 节点的左孩子存在
            queue.append(node.lchild) # 左孩子进入队列
        if node.rchild: # 节点的右孩子存在
            queue.append(node.rchild) # 右孩子入队

level_order(root)

输出结果

E,A,G,C,F,B,D,

代码实现原理

使用单向队列的性质,节点出队时,其对应的孩子节点入队。例如(以本节遍历二叉树为例):

  • [E]:根节点入队

  • E,[A,G]:E出队,对应的左孩子A和右孩子入队

  • E,A,[G,C]:A出队,A的右孩子C入队

  • E,A,G,[C,F]:G出队,G的右孩子F入队

  • E,A,G,C,[F,B,D]:C出队,C的左孩子B,右孩子D出队

  • E,A,G,C,F,[B,D]:F出队,F没有孩子节点

  • E,A,G,C,F,B,[D]:B出队,B没有孩子节点

  • E,A,G,C,F,B,D,[]:D出队,D没有孩子节点,队列为空,结束循环。

三、二叉搜索树

1、概念

二叉搜索树是一棵二叉树且满足性质:设x是二叉树的一个节点。如果y是x左子树的一个节点,那么y.key x.key;如果y是x右子树的一个节点,那么y.key x.key。

如下图为一棵二叉搜索树:

Python数据结构与算法-树_第5张图片

二叉搜索树的操作:查询、插入、删除

查询和插入的时间复杂度都为O(logn),删除操作较为复杂后面会具体分析。

2、二叉搜索树:插入

(1)递归实现插入

当插入值小于当前节点的值,当前节点的左孩子(左孩子子树)是插入值的节点;当插入值大于当前节点的值,当前节点的右孩子(右孩子子树)是插入值的节点;若该值插入的位置不存在节点或该值与当前节点值相同,则创建新的节点或覆盖该节点。

# 二叉搜索树的用递归写插入函数

class BiTreeNode(): # 二叉树节点
    def __init__(self, data) -> None: # 属性
        self.data = data # 树的值
        self.lchild = None # 左孩子
        self.rchild = None # 右孩子
        self.parent = None # 父节点

# 二叉搜索树 binary search tree
class BST():
    def __init__(self): # 创建空树
        self.root = None # 根节点为空

    # 递归插入
    def insert(self, node, val): # node是指二叉树中当前指向的节点,初始一般为根节点,val是指插入的值
        if not node or node.data == val:  # 空树或节点的值与插入的值相同
            node = BiTreeNode(val) # 创建一个节点插入到树中(最后一步)或者是插入的值的节点直接与原节点相重合
        
        elif val < node.data:  # 插入的值小于当前节点的值
            # 往当前节点的左边插,当前节点的也就往左孩子找
            node.lchild = self.insert(node.lchild,val) # 左孩子为根节点的子树上,node.lchild(当前点的左孩子) = node(插入的节点)
            node.lchild.parent = node  # 与父节点的连接
                    
        else:  # val > node.data
            node.rchild = self.insert(node.rchild,val) # 当前节点的右孩子是插入的节点
            node.rchild.parent = node  

        return node # 返回

    
    # 前序遍历
    def pre_order(self, root):
        if root:   # root不为空
            print(root.data, end = ',')
            self.pre_order(root.lchild)  # 访问左孩子
            self.pre_order(root.rchild)  # 访问右孩子


tree = BST() 
node = BiTreeNode(10) # 树的根节点
# 插入数值
tree.insert(node,5) 
tree.insert(node,19) 
tree.insert(node,8)
tree.insert(node,3)
tree.pre_order(node)

输出结果

10,5,3,8,19,

(2)普通方式实现插入

# 二叉搜索树普通办法写插入函数

class BiTreeNode(): # 二叉树节点
    def __init__(self, data) -> None: # 属性
        self.data = data # 树的值
        self.lchild = None # 左孩子
        self.rchild = None # 右孩子
        self.parent = None # 父节点

# 二叉搜索树 binary search tree
class BST():
    def __init__(self, li=None): # 创建树
        self.root = None # 根节点为空
        # 创建二叉搜索树
        if li: 
            for val in li:
                self.insert_no_dec(val) # 循环插入值


    def insert_no_dec(self,val): # 非递归
        p = self.root # 创建指针p,p起始指向根节点
        if not p: # p指向节点为空,空树,
            self.root = BiTreeNode(val)  # 创建根节点
            return 
        
        while True: # 循环
            if val < p.data: # 插入值小于p指向节点的值
                if p.lchild: # 左孩子节点存在
                    p = p.lchild # 指针移动至新的节点
                else: # 左孩子不存在
                    p.lchild = BiTreeNode(val) # 插入值
                    p.lchild.parent = p # 连接父节点
                    return  # 结束循环,返回
            
            elif val > p.data: # 插入值大于p指向节点的值
                if p.rchild:  # 右孩子存在
                    p = p.rchild # 指针移动至新节点
                else: # 右孩子不存在
                    p.rchild = BiTreeNode(val) # 插入值
                    p.rchild.parent = p # 连接父节点
                    return # 结束循环,返回
            else: # val == p.data
                return # 不用插入
            
    # 前序遍历
    def pre_order(self,root):
        if root:   # root不为空
            print(root.data, end = ',')
            self.pre_order(root.lchild)  # 访问左孩子
            self.pre_order(root.rchild)  # 访问右孩子

    # 中序遍历
    def in_order(self, root):
        if root:  # root不为空,递归结束条件
            self.in_order(root.lchild) # 访问左孩子
            print(root.data, end = ',') # 打印本身
            self.in_order(root.rchild) # 访问右孩子

    # 后序遍历
    def post_order(self, root):
        if root: # root不为空,递归结束条件
            self.post_order(root.lchild) # 访问左孩子
            self.post_order(root.rchild) # 访问右孩子
            print(root.data, end = ',') # 打印本身
    
tree = BST([4,6,7,9,2,1,3,5,8]) # 对象实例化

# 遍历二叉树
tree.pre_order(tree.root)
print("") 
tree.in_order(tree.root)
print("")
tree.post_order(tree.root)

输出结果:

4,2,1,3,6,5,7,9,8,
1,2,3,4,5,6,7,8,9,
1,3,2,5,8,9,7,6,4,

说明:中序遍历的二叉搜索树一定是升序输出

3、二叉搜索树:查询

查询函数的原理与插入函数的原理基本一致。

import random

class BiTreeNode(): # 二叉树节点
    def __init__(self, data) -> None: # 属性
        self.data = data # 树的值
        self.lchild = None # 左孩子
        self.rchild = None # 右孩子
        self.parent = None # 父节点

# 二叉搜索树 binary search tree
class BST():
    def __init__(self, li=None): # 创建树
        self.root = None # 根节点为空
        # 创建二叉搜索树
        if li: 
            for val in li:
                self.insert_no_dec(val) # 循环插入值

    def insert_no_dec(self,val): # 非递归插入
        p = self.root # 创建指针p,p起始指向根节点
        if not p: # p指向节点为空,空树,
            self.root = BiTreeNode(val)  # 创建根节点
            return 
        
        while True: # 循环
            if val < p.data: # 插入值小于p指向节点的值
                if p.lchild: # 左孩子节点存在
                    p = p.lchild # 指针移动至新的节点
                else: # 左孩子不存在
                    p.lchild = BiTreeNode(val) # 插入值
                    p.lchild.parent = p # 连接父节点
                    return  # 结束循环,返回
            
            elif val > p.data: # 插入值大于p指向节点的值
                if p.rchild:  # 右孩子存在
                    p = p.rchild # 指针移动至新节点
                else: # 右孩子不存在
                    p.rchild = BiTreeNode(val) # 插入值
                    p.rchild.parent = p # 连接父节点
                    return # 结束循环,返回
            else: # val == p.data
                return # 不用插入

    def query(self, node, val): # 递归写查询
        if not node: # 节点不存在
            return None # 返回none
        elif val > node.data: # 值大于当前节点的值,往右子树找
            node = self.query(node.rchild, val) # 变量node是返回的node的赋值
        elif val < node.data: # 值小于当前节点的值,往左子树找
            node = self.query(node.lchild, val) 
        else: # val == node.data
            node = node # 值相等时返回节点
        return node
    def query_no_rec(self, val): # 非递归查询
        p = self.root  # p指针初始指向根节点
        while p: # 不是空树
            if val < p.data: # 值小于当前节点,往左找
                p = p.lchild # p指针下移
            elif val > p.data: # 值大于当前节点,往右找
                p = p.rchild # p指针往右下移
            else: # val == p.data
                return p # 退出循环
         return None

li = list(range(0,10,2)) # 0-9的偶数
random.shuffle(li)
tree = BST(li) # 创建树
node = tree.root
# print(node.data)
print(tree.query(node, 5)) # 递归
print(tree.query_no_rec(4)) # 非递归

输出结果

None
<__main__.BiTreeNode object at 0x00000170A1C1C6A0>

4、二叉搜索树:删除

(1)删除操作原理

二叉搜索树的删除与双向链表的删除极为相似。

1)要删除的节点是叶子节点:直接删除。node.parent.lchild 或者 node.parent,rchild = None

Python数据结构与算法-树_第6张图片

2)要删除的节点只有一个孩子:将此节点的父亲与孩子连接,然后删除该节点。如果删除的节点是根节点,则需要调整子树节点的位置。

Python数据结构与算法-树_第7张图片

3)要删除的节点有两个孩子:将其右子树的值最小的节点(该节点最多有一个右孩子,也可能就是叶子节点),该点一定为右子树的各节点的最后一个左孩子,找到该节点并替换当前节点的值,再删除该接节点

Python数据结构与算法-树_第8张图片

(2)删除操作代码实现

# 二叉搜索树——删除
class BiTreeNode(): # 二叉树节点
    def __init__(self, data) -> None: # 属性
        self.data = data # 树的值
        self.lchild = None # 左孩子
        self.rchild = None # 右孩子
        self.parent = None # 父节点

# 二叉搜索树 binary search tree
class BST():
    def __init__(self, li=None): # 创建树
        self.root = None # 根节点为空
        # 创建二叉搜索树
        if li: 
            for val in li:
                self.insert_no_dec(val) # 循环插入值

    def insert_no_dec(self,val): # 非递归插入
        p = self.root # 创建指针p,p起始指向根节点
        if not p: # p指向节点为空,空树,
            self.root = BiTreeNode(val)  # 创建根节点
            return 
        
        while True: # 循环
            if val < p.data: # 插入值小于p指向节点的值
                if p.lchild: # 左孩子节点存在
                    p = p.lchild # 指针移动至新的节点
                else: # 左孩子不存在
                    p.lchild = BiTreeNode(val) # 插入值
                    p.lchild.parent = p # 连接父节点
                    return  # 结束循环,返回
            
            elif val > p.data: # 插入值大于p指向节点的值
                if p.rchild:  # 右孩子存在
                    p = p.rchild # 指针移动至新节点
                else: # 右孩子不存在
                    p.rchild = BiTreeNode(val) # 插入值
                    p.rchild.parent = p # 连接父节点
                    return # 结束循环,返回
            else: # val == p.data
                return # 不用插入

    def query(self, node, val): # 递归写查询
        if not node: # 节点不存在
            return None # 返回none
        elif val > node.data: # 值大于当前节点的值,往右子树找
            node = self.query(node.rchild, val) # 变量node是返回的node的赋值
        elif val < node.data: # 值小于当前节点的值,往左子树找
            node = self.query(node.lchild, val) 
        else: # val == node.data
            node = node # 值相等时返回节点
        return node
    def query_no_rec(self, val): # 非递归查询
        p = self.root  # p指针初始指向根节点
        while p: # 不是空树
            if val < p.data: # 值小于当前节点,往左找
                p = p.lchild # p指针下移
            elif val > p.data: # 值大于当前节点,往右找
                p = p.rchild # p指针往右下移
            else: # val == p.data
                return p # 退出循环
        return None
    # 中序遍历
    def in_order(self,root):
        if root:  # root不为空,递归结束条件
            self.in_order(root.lchild) # 访问左孩子
            print(root.data, end = ',') # 打印本身
            self.in_order(root.rchild) # 访问右孩子

    def __remove_node_1(self, node): # 情况1:叶子节点
        # 判断是否为根节点
        if not node.parent: 
            self.root = None  # 根节点为None,即删除根节点
        if node == node.parent.lchild: # node为左孩子
            node.parent.lchild = None
        else: # node为右孩子
            node.parent.rchild = None
    
    def __remove_node_21(self,node): # 情况2.1:只有一个左孩子
        if not node.parent: # 根节点
            self.root = node.lchild # 根节点为node的左孩子
            node.lchild.parent = None # 左孩子的父亲为空
        elif node == node.parent.lchild: # node是父亲的左孩子
            node.parent.lchild = node.lchild # node父亲的左孩子变为node的左孩子
            node.lchild.parent = node.parent # node左孩子的父亲变为node的父亲
        else: # node是父亲的右孩子
            node.parent.rchild = node.lchild # node父亲的右孩子变为node的左孩子
            node.lchild.parent = node.parent # node左孩子的父亲变为node的父亲
    
    def __remove_node_22(self,node): # 情况2.2:只有一个右孩子
        if not node.parent: # 根节点
            self.root = node.rchild # 根节点为node的右孩子
            node.rchild.parent = None # 根节点没有父节点
        elif node == node.parent.lchild: # node是父亲的左孩子
            node.parent.lchild = node.rchild # node父亲的左孩子变为node的右孩子
            node.rchild.parent = node.parent # node右孩子的父亲变为node的父亲
        else: # node为父亲的右孩子
            node.parent.rchild = node.rchild # node父亲的右孩子变为node的右孩子
            node.rchild.parent = node.parent # node右孩子的父亲变为node的父亲
    
    def delete(self,val): # 删除操作(合并)
        if self.root: # 不是空树
            node = self.query_no_rec(val)  # 找到该节点 这步错了
            if not node: # node不存在
                return False
            if not node.lchild and not node.rchild: # 叶子节点
                self.__remove_node_1(node) # 情况1
            elif not node.rchild: # node只有左孩子
                self.__remove_node_21(node)  # 情况2.1
            elif not node.lchild: # node只有右孩子
                self.__remove_node_22(node) # 情况2.2
            else: # 情况3 即有左孩子又有右孩子
                # 找min_node,右子树的最小节点
                min_node = node.rchild # min_node在右子树上
                while min_node.lchild: # 直到没有左孩子
                    min_node = min_node.lchild  # min_node一直往左孩子移动,寻找
                node.data = min_node.data # 互换两者的值
                # 删除min_node
                if min_node.rchild: # 只有右孩子
                    self.__remove_node_22(min_node)
                else: # min_node为叶子节点
                    self.__remove_node_1(min_node)

tree = BST([1,4,2,5,3,8,6,9,7])
tree.in_order(tree.root)
print("")

# 删除值
tree.delete(4)
tree.delete(8)
tree.in_order(tree.root)

结果输出

1,2,3,4,5,6,7,8,9,
1,2,3,5,6,7,9,

你可能感兴趣的:(python数据结构与算法,数据结构,python)