树,对于计算机编程语言来说是一个重要的数据结构。它具有广泛的应用,比如文件系统的分层数据结构和机器学习中的一些算法。这里创建了treelib来提供Python中树数据结构的高效实现。
主要通过pip和easy_install进行安装
windows下:
pip install treelib
Linux下:
sudo easy_install -U treelib
License许可:
Redistributed under Apache License (2.0) since version 1.3.0.
Source:Github:caesar0301/treelib
主要分为Tree和Node两个类,以支持多叉树的实现
构造函数:新建一棵树或通过深拷贝、浅拷贝方式复制一棵树
Tree(self, tree=None, deep=False)
len取长度:返回树的节点个数,同Tree.size()
len(Tree)
str字符串:Tree对象转换为str对象,可输出
str(Tree)
unicode字符串:Tree对象转换为unicode对象,可输出
unicode(Tree)
add_node(self, node, parent=None)
向树添加一个node节点,该节点为Node类对象,其父节点为parent
all_nodes(self)
以list返回所有节点
children(self, nid)
返回以nid为标识(identifier)子节点,nid不存在则返回list为空
contains(self, nid)
检查树中是否包含以nid为标识的节点
create_node(self, tag=None, identifier=None, parent=None, data=None)
以parent为父节点,在树上创建一个节点(类似于创建Node对象,在add_node添加Node)
depth(self, node=None)
返回树的深度(int),若给定node则返回以该节点为根的树的深度
expand_tree(self, nid=None, mode=1, filter=None, key=None, reverse=False)
Python生成器,松散地基于 John R. Anderson, Albert T. Corbett, and Brian J. Reiser的一个算法 (’Essential LISP’ , page 239-241)
UPDATE: the @filter function is performed on Node object during traversing.
UPDATE: the @key and @reverse are present to sort nodes at each level.
get_node(self, nid)
返回以nid为标识的节点,nid不存在则返回为空
is_branch(self, nid)
返回以nid为节点的子节点标识(identifier
)的list列表,nid不存在则返回list为空
leaves(self, root=None)
返回所有叶节点对象list列表,若给定root则返回以root为根节点的树的所有叶节点对象list列表
level(self, nid, filter=None)
返回指定深度的所有节点,根节点按深度0计算
Update: @filter params is added to calculate level passing exclusive nodes.
link_past_node(self, nid)
将某节点的父节点与子节点链接的方法,将该节点从树上删除
比如, 一个a -> b -> c树 ,删除b节点, 则剩下a -> c树
move_node(self, source, destination)
将source的节点移动至destination的子节点
parent(self, nid)
返回以nid为标识的节点的父节点
paste(self, nid, new_tree, deepcopy=False)
粘贴树,通过连接new_tree的根节点与nid标识的节点,设置deepcopy
可进行深拷贝
Update: add @deepcopy of pasted tree.
paths_to_leaves(self)
取得根节点到每一个叶节点的标识路径,返回值为标识list列表的list列表(二重列表),根节点不省略
比如一棵树:
Harry
|___ Bill
|___ Jane
| |___ Diane
| |___ George
| |___ Jill
| |___ Mary
| |___ Mark
输出结果:
[['harry', 'jane', 'diane', 'mary'],
['harry', 'jane', 'mark'],
['harry', 'jane', 'diane', 'george', 'jill'],
['harry', 'bill']]
remove_node(self, identifier)
移除以nid标识的节点,同时移除其所有的子节点
返回值为移除的节点个数
remove_subtree(self, nid)
移除以nid标识为根节点的一棵子树
返回值为移除该子树的树,nid不存在则返回一个空树
该方法类似于remove_node(self,nid)
实现效果相同但返回值不同:
remove_node
返回移除的节点个数
remove_subtree
返回移除该子树的树
建议使用remove_node
来删除节点,因为remove_subtree
将消耗内存以存储新树(返回值)
rsearch(self, nid, filter=None)
遍历从以nid为标识的节点到根节点的路径(枝)
save2file(self, filename, nid=None, level=0, idhidden=True, filter=None, key=None, reverse=False, line_type=u'ascii-ex', data_property=None)
将树保存到文件,以作离线分析
show(self, nid=None, level=0, idhidden=True, filter=None, key=None, reverse=False, line_type=u'ascii-ex', data_property=None)
输出树结构
siblings(self, nid)
返回以nid为标识的节点的兄弟节点
返回值为兄弟节点list列表,根节点无兄弟节点,返回空列表
size(self, level=None)
返回指定深度(level)节点个数,若无指定则返回整棵树节点个数
subtree(self, nid)
浅拷贝方式建立一个以nid为标识的节点作为根节点的子树,nid不存在则返回一个空树
若使用深拷贝,则请使用构造函数建立新树,如下:
e.g. new_tree = Tree(t.subtree(t.root), deep=True)
to_dict(self, nid=None, key=None, sort=True, reverse=False, with_data=False)
将树转换为dict字典
to_json(self, with_data=False, sort=True, reverse=False)
将树转换为JSON格式输出
构造函数:新建一个Node节点对象
变量 | 名称 | 说明 |
---|---|---|
tag | 标签 | 树输出时显示,默认为随机值 |
identifier | 标识 | 树中唯一,不可重复,默认为随机值 |
data | 数据 | 存储节点中数据 |
Node(self, tag=None, identifier=None, expanded=True, data=None)
is_leaf(self)
检查该节点是否是叶节点,返回布尔值
is_root(self)
检查该节点是否是根节点,返回布尔值
update_bpointer(self, nid)
设置_bpointer指针
update_fpointer(self, nid, mode=0)
设置_fpointer指针
来源于官方帮助文档:treelib.readthedocs.io
下面的实例,展示了建立一棵树的基本方法
>>> from treelib import Node, Tree
>>> tree = Tree()
>>> tree.create_node("Harry", "harry") # root node
>>> tree.create_node("Jane", "jane", parent="harry")
>>> tree.create_node("Bill", "bill", parent="harry")
>>> tree.create_node("Diane", "diane", parent="jane")
>>> tree.create_node("Mary", "mary", parent="diane")
>>> tree.create_node("Mark", "mark", parent="jane")
>>> tree.show()
Harry
├── Bill
└── Jane
├── Diane
│ └── Mary
└── Mark
下面根据上述的数作为例子,展示一部分API用法样例
* 例1:利用特殊方法扩展一棵树
>>> print(','.join([tree[node].tag for node in \
tree.expand_tree(mode=Tree.DEPTH)]))
Harry,Bill,Jane,Diane,Mary,Mark
>>> print(','.join([tree[node].tag for node in \
tree.expand_tree(filter = lambda x: \
x.identifier != 'diane')]))
Harry,Bill,Jane,Mark
>>> sub_t = tree.subtree('diane')
>>> sub_t.show()
Diane
└── Mary
>>> new_tree = Tree()
>>> new_tree.create_node("n1", 1) # root node
>>> new_tree.create_node("n2", 2, parent=1)
>>> new_tree.create_node("n3", 3, parent=1)
>>> tree.paste('bill', new_tree)
>>> tree.show()
Harry
├── Bill
│ └── n1
│ ├── n2
│ └── n3
└── Jane
├── Diane
│ └── Mary
└── Mark
>>> tree.remove_node(1)
>>> tree.show()
Harry
├── Bill
└── Jane
├── Diane
│ └── Mary
└── Mark
>>> tree.move_node('mary', 'harry')
>>> tree.show()
Harry
├── Bill
├── Jane
│ ├── Diane
│ └── Mark
└── Mary
>>> tree.depth()
2
>>> node = tree.get_node("bill")
>>> tree.depth(node)
1
以“ascii-em”形式输出:
>>> tree.show(line_type="ascii-em")
Harry
╠══ Bill
╠══ Jane
║ ╠══ Diane
║ ╚══ Mark
╚══ Mary
以JSON格式输出:
>>> print(tree.to_json(with_data=True))
{"Harry": {"data": null, "children": [{"Bill": {"data": null}}, {"Jane": {"data": null, "children": [{"Diane": {"data": null}}, {"Mark": {"data": null}}]}}, {"Mary": {"data": null}}]}}
有时,你需要树来存储你的数据结构,在最新版本的treelib当中支持了.data
属性,可以存储任何数据。
比如,定义一个Flower
类:
>>> class Flower(object): \
def __init__(self, color): \
self.color = color
于是可以建立Flower
树:
>>> ftree = Tree()
>>> ftree.create_node("Root", "root", data=Flower("black"))
>>> ftree.create_node("F1", "f1", parent='root', data=Flower("white"))
>>> ftree.create_node("F2", "f2", parent='root', data=Flower("red"))
按照.data
的属性输出树结构:
>>> ftree.show(data_property="color")
black
├── white
└── red
注意:在1.2.5版本之前,你需要继承并重写Node类方法,比如:
>>> class FlowerNode(treelib.Node): \
def __init__(self, color): \
self.color = color
>>> # create a new node
>>> fnode = FlowerNode("white")