wikioi1040 统计单词个数

给出一个长度不超过200的由小写英文字母组成的字母串(约定;该字串以每行20个字母的方式输入,且保证每行一定为20个)。要求将此字母串分成k份(1<k<=40),且每份中包含的单词个数加起来总数最大(每份中包含的单词可以部分重叠。当选用一个单词之后,其第一个字母不能再用。例如字符串this中可包含this和is,选用this之后就不能包含th)(管理员注:这里的不能再用指的是位置,不是字母本身。比如thisis可以算做包含2个is)。
单词在给出的一个不超过6个单词的字典中。
要求输出最大的个数。

第一行为一个正整数(0<n<=5)表示有n组测试数据
每组的第一行有二个正整数(p,k)
p表示字串的行数;
k表示分为k个部分。
接下来的p行,每行均有20个字符。
再接下来有一个正整数s,表示字典中单词个数。(1<=s<=6)
接下来的s行,每行均有一个单词。

每行一个整数,分别对应每组测试数据的相应结果。


1
1 3
thisisabookyouareaoh
4
is
a
ok
sab

7

this/isabookyoua/reaoh


刚看到这个题目觉得很迷茫,没入手点,但是突然看到了闪亮的突破口:

题目中说this包含this和is,但不包含th这也就是说在一个串,

对于一个固定了起点的单词只能用一次,即使他还可以构成别的单词但他还是用一次。比如:串:thisa

字典:this is th

串中有this  is  th这三个单词,但是对于this 和 th 只用一次,

也就是说枚举一下构成单词的起点,只要以该起点的串中包含可以构成一个以该起点开头的单词,

那么就说明这个串中多包含一个单词。

这样可以得出下面的结果:

枚举的起点                                                  结论:

t                                                             至少包含1个

h                                                            至少包含1个

i                                                             至少包含2个

s                                                            至少包含2个

a                                                            至少包含2个

考虑到这里,就有点眉目了。

题目中要将串分k个部分,也就是说从一个点截断后一个单词就未必可以构成了。

比如上例要分3个部分,合理的其中的一个部分至多有3个字母,这样this这个单词就构不成了。

要是分5个部分,那就连一个单词都构不成了。

这样就需要对上面做个改动,上面的只控制了起点,

而在题目中还需要限制终点,分完几个部分后,每部分终点不同可以构成的单词就不同了。

这样就需要再枚举终点了。

设计一个二维数组sum[i,j],统计从i到j的串中包含的单词的个数。

状态转移方程:

sum[i+1,j]+1                 (s[i,j]中包含以s[i]开头的单词)

sum[i,j]= sum[i+1,j]      (与上面相反)

注:(1)这里枚举字符的起点的顺序是从尾到头的。

       (2)有人把上面这次也看做是一次动态规划,但我觉得更准确的说是递推。

求出所有的sum还差一步,就是不同的划分方法显然结果是不一样的,

但是对于求解的问题我们可以这样把原问题分解成子问题:

求把一个串分成k部分的最多单词个数,可以看做是先把串的最后一部分分出来,

再把前面一部分分解成k-1个部分,

显然决策就是找到一种划分的方法是前面的k-1部分的单词+最后一部分的单词最多。

显然这个问题满足最优化原理,那满不满足无后效性呢?

对于一个串分解出最后一部分在分解前面的那部分是根本就不会涉及分好的这部分,

换句话说每次分解都会把串分解的更小,对于分解这个更小的串不会用到不属于这个小串的元素。

这就满足无后效性。

具体求解过程:

设计一个状态opt[i,j],表示把从1到j的串分成i份可以得到最多的单词的个数。

决策就是枚举分割点使当前这种分割方法可以获得最多的单词。

状态转移方程:opt[i,j]=max(opt[i-1,t]+sum[t+1,j])  (i<t<j)

边界条件:opt[1,i]=sum[1,i]  (0<i<=L)

时间复杂度:状态数O(N2)*决策数O(N)=O(N3),空间复杂度:O(N2)。


#include <stdio.h>
#include <string.h>

int word[201][201], dp[201][201][41];
char c[21], w[6][10], c0[201], c1[201];
int d, p, k, s, max, le[6], len;

int main()
{
	int i, j, l, m, yes, x, st;
 	scanf("%d", &d);
 	while(d--)
	{
		scanf("%d%d", &p, &k);
  		for(j = 0; j < p; j++)
		{
   			scanf("%s", c);
   			if(j == 0)	strcpy(c0, c);
   			else		strcat(c0, c);
  		}
  		len = strlen(c0);
  		scanf("%d", &s);
  		for(j = 0; j < s; j++)
		{
   			scanf("%s", w[j]);
   			le[j] = strlen(w[j]);
  		}
  		for(i = 0; i < len; i++)
   			for(j = 0; j < len; j++)
    			word[i][j] = 0; 
//************************************************************************
/*算出第j个:c0[j-1]到第i个:c0[i-1]不分时最多有单词word[j][i]个*/
  		for(i = len-1; i >= 0; i--) 
   			for(j = len-1; j >= 0; j--)
			{
    			for(l = 0; l < s; l++)
				{
     				yes = 0;
     				if(c0[j] == w[l][0] && le[l] <= i-j+1)
					{
      					yes = 1; 
      					for(m = 0; m < le[l]; m++)
       						if(c0[j+m] != w[l][m])
       						{
						   		yes = 0; 
						   		break; 
							}
     				}
     				if(yes == 1)	break;
    			}
    			if(yes == 1)	word[j][i] = word[j+1][i]+1; 
    			else			word[j][i] = word[j+1][i];
   			}
//*************************************************************************
/*算出 第i个: c0[i-1] 到 第j个:c0[j-1] 分st等份最多有单词dp[i][j][st]个*/
  		for(st = 1; st <= k; st++)
   			for(i = 0; i < len-st+1; i++)
    			for(j = i+st-1; j < len; j++)
				{
     				if(st == 1)
					{
						dp[i][j][st] = word[i][j]; 
						continue; 
					}
     			for(max = 0, l = i+st-2; l < j; l++) 
				{
      				x = dp[i][l][st-1]+word[l+1][j];
      				if(x > max)	max = x;
     			}
     			dp[i][j][st] = max;
    			}
//************************************************************************
  		printf("%d\n", dp[0][len-1][k]);
 	}
 	return 0;
}


你可能感兴趣的:(wikioi1040 统计单词个数)