字典树的简单介绍及其如何求最短前缀

Trie,又称字典树、单词查找树,是一种树形结构,用于保存大量的字符串,其核心思想是空间换时间。它的优点是:利用字符串的公共前缀来节约存储空间。

假设有b,abc,abd,bcd,abcd,efg,hii这6个单词,我们构建的树就是这样的

字典树的简单介绍及其如何求最短前缀_第1张图片

对于每一个节点,从根遍历到他的过程就是一个单词,如果这个节点被标记为红色,就表示这个单词存在,否则不存在。

那么,对于一个单词,我只要顺着他从跟走到对应的节点,再看这个节点是否被标记为红色就可以知道它是否出现过了。把这个节点标记为红色,就相当于插入了这个单词。

字典树的主要运用就是找单词的前缀。

下面直接贴出Trie模板

struct Trie
{
    int cnt;//用来记录某个节点字符出现的子树
    Trie *next[26];
    Trie(){cnt = 0;
        for(int i = 0 ; i < 26 ; i ++)
            next[i] = NULL;
    }
};

void insert(char *w,Trie *rt)
{
    Trie *p = rt;
    for(int i = 0 ; i < strlen(w) ; i ++)
    {
        if(p->next[w[i]-'a']) p->next[w[i]-'a']->cnt ++;
        else if(p->next[w[i]-'a'] == NULL)
        {
            p->next[w[i]-'a'] = new Trie;
            p->next[w[i]-'a']->cnt = 1;
        }
        p = p->next[w[i]-'a'];
    }
}

int search(char *w,Trie *rt)
{
    Trie *p = rt;
    if(rt == NULL) return 0;
    for(int i = 0 ; i < strlen(w); i ++)
    {
        if(p->next[w[i]-'a'])
            p = p->next[w[i]-'a'];
            else return 0;
    }
    return p->cnt;//返回有多少个单词是以w为前缀的
}


最短前缀,一般都是用字典树来求

carbohydrate carboh
cart cart
carburetor carbu
caramel cara
caribou cari
carbonic carboni
cartilage carti
carbon carbon
carriage carr
carton carto
car car
carbonate carbona
上面的单词,后面的就是其最短前缀

求最短前缀只需要略微修改search函数

void search(Trie *root,char *word)
{
    Trie *rt = root;
    if(rt == NULL) return ;
    for(int i = 0 ; i  < strlen(word) ; i ++)
    {
        int j = word[i] - 'a';
        if(rt->next[j] == NULL) return;
        printf("%c",word[i]);
        if(rt->next[j]->cnt == 1) break;//关键就是这里,只要单词word的接下来一个字符在字典树的个数为1,那么其前面的字符集就是其最短前缀,道理很好懂
        rt = rt->next[j];
    }
}

POJ 2001就是求最短前缀


你可能感兴趣的:(c,struct,null,search,存储,insert)