杭电1251 统计难题(字典树)

Ignatius最近遇到一个难题,老师交给他很多单词(只有小写字母组成,不会有重复的单词出现),现在老师要他统计出以某个字符串为前缀的单词数量(单词本身也是自己的前缀).

Input

输入数据的第一部分是一张单词表,每行一个单词,单词的长度不超过10,它们代表的是老师交给Ignatius统计的单词,一个空行代表单词表的结束.第二部分是一连串的提问,每行一个提问,每个提问都是一个字符串.

注意:本题只有一组测试数据,处理到文件结束.

Output

对于每个提问,给出以该字符串为前缀的单词的数量.

Sample Input

banana
band
bee
absolute
acm

ba
b
band
abc

Sample Output

2 3 1 

0

字典树百度百科:又称单词查找树,Trie树,是一种树形结构,是一种哈希树的变种。典型应用是用于统计,排序和保存大量的字符串(但不仅限于字符串),所以经常被搜索引擎系统用于文本词频统计。它的优点是:利用字符串的公共前缀来减少查询时间,最大限度地减少无谓的字符串比较,查询效率比哈希表高。

学习了字典树之后,觉得它很明显的就是用空间来换时间,空间复杂度特别大,比如字典数单单存26个小写字母,那么每个节点的孩子节点都有26个孩子节点,字典树中的每一层都保留着不同单词的相同字母。

为了好说明,假设,所有的单词只包括a,b,c,d四个字母,那么树是这样建立的。

杭电1251 统计难题(字典树)_第1张图片

#include <iostream>
#include <string.h>
#include <stdio.h>
#include <malloc.h>
using namespace std;
char str[12];
const int maxn=26;//孩子节点的最大个数,如果是只有26个字母,就用26就可以了。

struct Trie//树的结构体
{
    int cnt;//保存某个字母出现的次数
    Trie *next[maxn];//每一个节点对应着多少个孩子,如果只有26个字母,就用26就可以了
};

Trie root;

/*void init(Trie t)
{
    for(int i=0;i<26;i++)
        t.next[i]=NULL;
}*///不需要单独对根节点初始化

void CreateTrie(char *str)
{
    int len=strlen(str);
    Trie *p=&root,*q;
    for(int i=0;i<len;i++)
    {
        int id=str[i]-'a';
        if(p->next[id]==NULL)//第一次遇到
        {
            q=(Trie*)malloc(sizeof(Trie));
            q->cnt=1;//此处一开始写错,写成了q->cnt++;
            for(int i=0;i<maxn;i++)
                q->next[i]=NULL;//初始化非空节点的孩子节点
            p->next[id]=q;//在树中填上
            p=p->next[id];//此时的P是不为空的节点
        }
        else
        {
            p->next[id]->cnt++;//不是第一次遇到,个数++
            p=p->next[id];
        }
    }
}

int find(char *str)
{
    int len=strlen(str);
    Trie *p=&root;
    for(int i=0;i<len;i++)
    {
        int id=str[i]-'a';
        p=p->next[id];//一直向下走。
        if(p==NULL)//找不到该单词,一开始此处写错了,写成了p->next[id]==NULL
            return 0;
    }
    return p->cnt;
}
int main()
{
    while(gets(str)&&str[0]!='\0')
    {
        CreateTrie(str);
    }
    while(scanf("%s",str)!=EOF)
    {
        printf("%d\n",find(str));
    }
    return 0;
}


你可能感兴趣的:(杭电,解题报告,字典树)