数据结构与算法(树)

1.树的概念

是一种抽象数据类型(ADT)或是实作这种抽象数据类型的数据结构,用来模拟具有树状结构性质的数据集合。它是由n(n>=1)个有限节点组成一个具有层次关系的集合。把它叫做“树“是因为它看起来像一颗倒挂的数,也就是说它的根朝上,而叶朝下。它具有以下的特点:

  1. 每个节点有零个或多个子节点;
  2. 没有父节点的节点称为根节点;
  3. 每一个非根节点有且只有一个父节点;
  4. 除了根节点外,每个子节点可以分为多个不相交的子树;

比如:

Treedatastructure.png

2.树的术语

  • 节点的度:一个节点含有的子树的个数称为该节点的度;
  • 树的度:一棵树中,最大的节点的度称为树的度;
  • 叶节点终端节点:度为零的节点;
  • 父节点:若一个节点含有子节点,则这个节点称为其子节点的父节点;
  • 子节点:一个节点含有的子树的根节点称为该节点的子节点;
  • 兄弟节点:具有相同父节点的节点互称为兄弟节点;
  • 节点的层次:从根开始起,根为第一层,根的子节点为第二层,依次类推;
  • 树的高度深度:树中节点的最大层次;
  • 堂兄弟节点:父节点在同一层的节点互为堂兄弟节点;
  • 节点的祖先:从根到该节点所经过分支上的所有节点;
  • 子孙:以某节点为根的子树中任一节点都称为该节点的子孙;
  • 森林:有m(m>=0)棵互不相交的树的集合称为森林;

3.树的种类

  • 无序树:树中任意节点的子节点之间没有顺序关系,这种树称为无序树,也称为自由树;
  • 有序树:树中任意节点的子节点之间有顺序关系,这种树称为有序树;
    • 二叉树:每个节点最多含有两个子树的树称为二叉树;
      • 完全二叉树:对于一个二叉树,假设其深度为d(d>1)。除了第d层外,其它各层的节点数目均已到达最大值,且第d层所有节点从左向右连续紧密排列,这样的二叉树被称为完全二叉树,其中满二叉树的定义是所有节点都在最底层的完全二叉树;
      • 平衡二叉树(AVL树):当且仅当任何节点的两棵子树的高度差不大于1的二叉树;
      • 排序二叉树(二叉查找树):也称二叉搜索树,有序二叉树;
    • 霍夫曼树:用于信息编码,带权路径最短的二叉树称为霍夫曼树或最优二叉树;
    • B树:一种对读写操作进行优化的自平衡的二叉查找树,能够保持数据有序,拥有多余两个子树。

4.树的存储与表示

顺序存储

将数据结构存储在固定的数组中,在遍历速度上有一定的优势,但因所占空间比较大,是非主流二叉树。二叉树通常以链式存储。

树的顺序存储.png

链式存储

树的链式存储.png

由于对节点的个数无法掌握,常见树的存储表示都转换成二叉树进行处理,子节点个数最多为2 。

5.常见的树的应用场景

  1. xml,HTML等,编写这些东西的解析器的时候,用到树;
  2. 路由协议就是使用了树的算法;
  3. MySQL数据库索引
  4. 文件系统的目录结构
  5. AI算法中的树搜索。

参考:数据结构与算法Python语言描述

你可能感兴趣的:(数据结构与算法(树))