UVA 1401 Remember the Word

题意:给出一个字符串和S个单词组成的字典,问把这个字符串分解成若干单词的连接,总共有多少种?(单词可重复)

解析:这是刘汝佳白皮书的关于Trie树的入门,也是我接触的第一题。总的思路就是可以用递推来求到底有多少种分解方法。假如用d[i]表示从第i个字符开始往后的后缀字符串的分解方法,即s[i]->s[len]  (len为字符串长度)之间的字符串。

那么假如说在s[i...len]的字符串中发现s[i...i+n]是一个字典中的单词,那么d[i]  = d[i] + d[i+n];同理的话d[i] = sum{ d[i+len(x)]  },x是s[i...len] 的一个前缀单词。

那么我们不可能枚举所有的单词x来判断他是否是s[i...len]的一个前缀,那样必然超时,所以我们就把字典中的单词全部都存到Trie树中,在树中查找单词。


关于Trie树,我们对所有的节点全都从1到n标上序号,其中0为根节点,那么总共有sz个节点。然后因为字符集只是小写字母,所以我们用ch[i][0] != 0表示节点i有个子节点是字符'a',ch[i][1] != 0表示节点i有个子节点为'b',ch[i][2] = 0表示节点i没有'c'的子节点.

其中Trie树还有个附加信息,存在val[]中,如果该点是单词节点的话,val[]中存储的就是该点的该单词的长度,否则val[]为0



 

#include"stdio.h"

#include"string.h"

#include"vector"

using namespace std;

#define maxnode 100*4000+10		//跟sz的大小相同

#define sigma_size 27

#define Mod 20071027



vector<int>ans;		//用来存储字符串后缀中所存在单词的长度

struct Trie{

	int ch[maxnode][sigma_size];	//用来存储Trie树

	int val[maxnode];				//树节点的附加信息

	int sz;							//整棵树节点的总数

	void init(){			

		sz = 1;				//初始只有一个根节点,编号为0

		memset(ch[0],0,sizeof(ch[0]));

	}

	int idx(char c){

		return c - 'a';		//对于小写字母集,获得c的编号

	}



	//插入字符串s,v代表的是附加信息。如果v为0代表本节点不是单词节点,所以v必须非0

	void insert(char *s,int v){

		int u = 0,len = strlen(s);

		for(int i = 0 ; i < len ; i ++){

			int c = idx(s[i]);

			if(!ch[u][c]){		//如果该节点不存在

				memset(ch[sz],0,sizeof(ch[sz]));

				val[sz] = 0;		//中间节点,不是单词节点,附加信息为0

				ch[u][c] = sz++;	//新建节点

			}

			u = ch[u][c];	//到下一节点

		}

		val[u] = v;		//字符串最后一个必然是单词节点

	}



	//查询从指针s开始长度为len的字符串是否存在

	void find(char *s , int len){

		int u = 0;

		//int len = strlen(s);	每次都求长度的话会超时,所以找规律

		ans.clear();

		for(int i = 0 ; i < len ; i++){

			int c = idx(s[i]);

			if(!ch[u][c])

				return ;	//不存在该字符串

			u = ch[u][c];

			if(val[u])	//如果发现该节点是单词节点,就把该单词长度存入ans

				ans.push_back(val[u]);

		}

	}

}t;



int d[300010];

char str[300010],temp[110];

int n;



void solve(){

	memset(d,0,sizeof(d));

	int len = strlen(str);

	d[len] = 1;			//给予一个初始值

	for(int i = len - 1; i >= 0 ; i--){

		t.find(str+i,len-i);

		for(int j = 0 ; j < ans.size(); j++){

			d[i] = (d[i]+d[i+ans[j]])%Mod;

		}

	}

	printf("%d\n",d[0]);

}



int main(){

	memset(str,0,sizeof(str));

	int Case = 1;

	while(scanf("%s",str) != EOF){

		scanf("%d",&n);

		t.init();

		for(int i = 0 ; i < n ; i ++){

			scanf("%s",temp);

			int len = strlen(temp);

			t.insert(temp,len);	//单词节点储存的信息就是该单词的长度

		}

		printf("Case %d: ",Case++);

		solve();

	}

	return 0;

}


 

 

你可能感兴趣的:(word)