数据结构之Tire树

1.0 简介

也叫字典树

又称单词查找树 是一种树形结构,是一种哈希树的变种。

典型应用是用于统计,排序和保存大量的字符串(但不仅限于字符串),

所以经常被搜索引擎系统用于文本词频统计。

它的优点是:利用字符串的公共前缀来减少查询时间,最大限度地减少无谓的字符串比较,查询效率比哈希树高。

数据结构之Tire树_第1张图片

2.0 字典树具有如下性质:

  1. 根节点不包含字符,除根节点外每一个节点都只包含一个字符。
  2. 从根节点到某一节点,路径上经过的字符连接起来,为该节点对应的字符串。
  3. 每个节点的所有子节点包含的字符都不相同。

3.0 节点结构

一般来说MAX是26 因为26个英文字母呗

next是表示每层有多少种类的数,如果只是小写字母,则26即可,若改为大小写字母,则是52,若再加上数字,

则是62了,这里根 据题意来确定。

typedef struct TrieNode                     //Trie结点声明    
{   
    bool isStr;                            //标记该结点处是否构成单词    
    int data;
    struct TrieNode *next[MAX];            //儿子分支    
}Trie;  

4.0 字典树的操作

查找、插入和删除 删除比较少见

4.1 创建

  1. 考察字符串的第一个字母
  2. 顺着字典树的相应路径走 例如是a则走第一条路径 c就第三条这样的 可以利用 *p-‘a’ 获取这个字符位于第几个子节点
  3. 如果没有就创建

每个字典树的用法和定义均是根据自己情况定义 懂这个思想就行了 不用太拘泥于我这个

4.2 查找

查找就是按前缀一个个查,查到了就接着查、。。
每次从根结点开始进行搜索;

  1. 取要查找关键词的第一个字母,并根据该字母选择对应的子树并转到该子树继续进行检索;
  2. 在相应的子树上,取得要查找关键词的第二个字母,并进一步选择对应的子树进行检索; 
  3. 迭代上面的过程
  4. 直到在某个结点处
    1. 如果最后有个字母查到,则返回这个节点的信息
    2. 如果最后这个节点没有任何信息 则返回查询失败

4.3 删除

有些题目,数据比较大,需要查询完之后释放内存

删除算法 采用递归算法

void del(node *root){  
    for(int i = 0; i if(root->next[i] != NULL)  
            del(root->next[i]);  
    delete(root);  
}  

你可能感兴趣的:(数据结构之Tire树)