数据结构之字典树

什么是字典树

字典树是一种树形结构,利用字符串的公共前缀来减少查询时间,以空间换时间;根节点不包含字符,除根节点外每一个节点都只包含一个字符;从根节点到某一节点,路径上经过的字符连接起来,为该节点对应的字符串。


数据结构之字典树_第1张图片


如图是一个字典树,共有12个节点不为NULL,其中根节点不包含字符。那么这棵树中有几个单词呢?hell、hello、help、world,共四个单词。节点标记为红色表示根节点到该节点所形成的字符串存在。

 

如何实现字典树

下面以字符串查找问题为例,介绍字典树使用。
问题描述如下:
实现一个 Trie,包含 insert, search, 和 startsWith 这三个方法, 假设所有单词均由小写字母组成。
insert插入单词,search查找单词,startsWith是否包含以查询词为前缀的单词。
样例
insert(“hello”)
search(“hell”) // return false
startsWith(“hell”) // return true
startsWith(“helloworld”) // return false
insert(“helloworld”)
search(“hello) // return true
startsWith(“helloworld”) // return true

 

字符种类数目

const int MAX_CHAR = 26;

字典树节点TrieNode

child是TrieNode指针数组,指向子节点,0-25这26个下标与a-z这26个小写字母一一对应。
也就是说,一个节点表示哪个字符,是由该节点在父节点的child数组的下标所决定的。
flag标记当前字符串是否存在,true相当于在前面的图中将节点标记为红色,false则为黑色。

 

 

字典树TrieTree

只是将TrieNode实现的方法进行封装。

 

 

#include<cstdio>
#include<cstring>
#include<iostream>
#include<string>
#include<algorithm>
using namespace std;

const int MAX_CHAR=26;
class TrieNode {
    public:
        TrieNode()
        {
            flag=false;
            for(int i=0;i<MAX_CHAR; i++) {
                childs[i]=NULL;
            }
        }
        ~TrieNode()
        {
            for(int i=0;i<MAX_CHAR; i++) if(childs[i]!=NULL) {
                    delete childs[i];
                    childs[i]=NULL;
            }
           
        }
        //递归插入一个单词,每次建立其中的一个字符
        void insert(const string& word, int i)
        {
            int pos=word[i]-'a';

            if(childs[pos]==NULL)
                childs[pos]=new TrieNode;

            if((int)word.length()-1==i) childs[pos]->flag=true;
            else childs[pos]->insert(word, i+1);
        }
        //递归查找一个单词,每次校验其中的一个字符
        bool search(const string& word, int i)
        {
            int pos=word[i]-'a';
            //当前位置字符在当前节点的孩子对应于NULL,查找失败
            if(childs[pos]==NULL) return false;
            //若查找到了最后一个字符,当前节点的对应孩子的flag标记了该单词是否存在
            //否则递归校验
            if((int)word.length()-1==i) return childs[pos]->flag;
            else return childs[pos]->search(word, i+1);
        }

        bool startwith(const string& word, int i)
        {
            int pos=word[i]-'a';

            if(childs[pos]==NULL) return false;
            //只要查找到最后一个字符前未失败说明以该单词为前缀的单词存在
            if((int)word.length()-1==i) return true;
            else return childs[pos]->startwith(word, i+1);
        }
    private:
        TrieNode* childs[MAX_CHAR];
        bool flag;

};

class TrieTree {
    public:
        TrieTree()
        {
            root=new TrieNode();
        }
        ~TrieTree()
        {
           delete root;
        }
        void insert(const string& word)
        {
            root->insert(word, 0);   
        }
        bool search(const string& word)
        {
            return root->search(word, 0);
        }
        bool startwith(const string& word)
        {
            return root->startwith(word, 0);
        }
    private:
        TrieNode* root;
};

const char* str[]
{
    "hello",
        "helloworld",
        "acm",
    "acmhello",
        "helloo",
};

const char* str2[]
{
    "acmhell",
        "helloo",
        "acmh"
};

const char* str3[]
{
    "hell",
        "heo",
        "helo",
        "xxx",
        "acm"
};
int main()
{
    TrieTree trie;
    for(int i=0;i<sizeof(str)/sizeof(str[0]); i++)
            trie.insert(str[i]);

    for(int i=0;i<sizeof(str)/sizeof(str[0]); i++)
        if(trie.search(str[i]))
            cout<<"find "<<str[i]<<endl;
        else
            cout<<"not find "<<str[i]<<endl;

    for(int i=0;i<sizeof(str2)/sizeof(str2[0]); i++)
        if(trie.search(str2[i]))
            cout<<"find "<<str2[i]<<endl;
        else
            cout<<"not find "<<str2[i]<<endl;

    for(int i=0;i<sizeof(str3)/sizeof(str3[0]); i++)
        if(trie.startwith(str3[i]))
            cout<<"startwith "<<str3[i]<<endl;
        else
            cout<<"not startwith "<<str3[i]<<endl;
    return 0;
}

你可能感兴趣的:(数据结构之字典树)