HDOJ1251(统计难题)

统计难题

Time Limit: 4000/2000 MS (Java/Others)    Memory Limit: 131070/65535 K (Java/Others)
Total Submission(s): 2117    Accepted Submission(s): 679


Problem Description
Ignatius最近遇到一个难题,老师交给他很多单词(只有小写字母组成,不会有重复的单词出现),现在老师要他统计出以某个字符串为前缀的单词数量(单词本身也是自己的前缀).
 

Input
输入数据的第一部分是一张单词表,每行一个单词,单词的长度不超过10,它们代表的是老师交给Ignatius统计的单词,一个空行代表单词表的结束.第二部分是一连串的提问,每行一个提问,每个提问都是一个字符串.

注意:本题只有一组测试数据,处理到文件结束.
 

Output
对于每个提问,给出以该字符串为前缀的单词的数量.
 

Sample Input
banana

band

bee

absolute

acm

ba

b

band

abc
 

Sample Output
2

3

1

0

  

字典树(Trie)

是一种用于快速检索的多叉树结构。Trie把要查找的关键词看作一个字符序列,并根据构成关键词字符的先后顺序构造用于检索的树结构;一棵m度的Trie树或者为空,或者由m棵m度的Trie树构成。特别地:和二叉查找树不同,在Trie树中,每个结点上并非存储一个元素。

特点:(1)利用串的公共前缀->节约内存;(2)根结点不包含任何字母;(3)其余结点仅包含一个字母(非元素);(4)每个结点的子节点包含字母不同

查找过程如下:

<1>在trie树上进行检索总是始于根结点。

<2>取得要查找关键词的第一个字母,并根据该字母选择对应的子树并转到该子树继续进行检索。

<3>在相应的子树上,取得要查找关键词的第二个字母,并进一步选择对应的子树进行检索。

<4>在某个结点处,关键词的所有字母已被取出,则读取附在该结点上的信息,即完成查找

在trie树中查找一个关键字的时间和树中包含的结点数无关,而取决于组成关键字的字符数。

 

//Accepted 1251 93MS 43776K 1968 B C++ Xredman 
#include <iostream>
#include 
<cstring>
using namespace std;

const int N = 26;

typedef 
struct dicTNode
{
    
struct dicTNode *child[N];
    
int cnt;
}
dicTNode,*dictree;


void init(dictree &root)
{//对根结点初始化,根节点不存储任何数据
    root = new dicTNode;
    
for(int i = 0; i < N; i++)
        root
->child[i] = NULL;
    root
->cnt = 0;
}


void insert(char *str, dictree &root)
{
    dictree current, newnode;
    
int len =strlen(str);
    
int i, j;

    
if(len == 0)
        
return ;//无需插入情况

    current 
= root;
    
for(i = 0; i < len; i++)
    
{
        
if(current->child[str[i] - 'a'])
        
{//子树存在
            current = current->child[str[i] - 'a'];
            current
->cnt++;//相应子树加1
        }

        
else
        
{//子树不存在,则建树并初始化,指向下一结点

            
////////////新建子树并初始化////////////
            newnode = new dicTNode;
            
for(j = 0; j < N; j++)
                newnode
->child[j] = NULL;
            newnode
->cnt = 1;

            current
->child[str[i] - 'a'= newnode;
            current 
= current->child[str[i] - 'a'];
        }

    }

}


int find(char *str, dictree root)   
{   
    
int i,len;   
    dictree current;  
    len
=strlen(str);
    
if(len==0return 0;  
    
    current
=root;   
    
for(i=0;i<len;i++)   
    
{//一直遍历到此串底
        if(current->child[str[i]-'a'])   
            current 
= current->child[str[i]-'a'];   
        
else return 0;   
    }
   
    
return current->cnt;   
}
 

void dfs(dictree &tt)
{//销毁字典树,此步一般可略去
    if(tt)
    
{
        
for(int i = 0; i < 10; i++)
        dfs(tt
->child[i]);
    }

    free(tt);
    tt 
= NULL;

}


int main()
{
    
int n, j, ll;
    
char str[12];
    dictree root;

    init(root);
    
while(gets(str),strcmp(str,""!= 0)
        insert(str, root);

    
while(scanf("%s", str) != EOF)
    
{
        printf(
"%d\n", find(str, root));
    }

    dfs(root);
    
return 0;
}
 

你可能感兴趣的:(统计)