题目链接:http://acm.zju.edu.cn/onlinejudge/showProblem.do?problemId=4629
题目大意:给定两个串S和T,从S中找两个子串组成T(拼起来和T一模一样),两个子串可重叠,问有几种组合方法?
解题思路:这题可用KMP解。第一步是要找到T中的每个前缀在S中出现了几次,最开始的想法是将S拼到T后面,然后计算next数组,再对next数组排序,找到比next[i] = L大的个数,就是前缀长度为L的出现次数。这无疑是错的,但拼接的方法还是可取的,只要经过处理,把next数组的各值映射到一个cnt数组(cnt[i]表示前缀长度为i的子串出现几次)中,然后再递归,让cnt[next[i]] += cnt[i]。这是一种处理方法,但是后来我用了另一种方法,直接用T去匹配S,匹配到T中的T[j]时,说明长度为j的前缀出现了,更新cnt[j],然后通过递归计算cnt[next[i]] += cnt[i]。为什么要这样计算呢?因为当某个前缀是另一个前缀的后缀时,会出现少计算的情况,更新的时候只更新后面那个前缀的出现次数而不更新前面的前缀。比如aabaa,aa和aabaa两个前缀就会出现少计算的情况,最后需要cnt[2] += cnt[5]。
这样处理得到了一个关于前缀出现次数的数组,也就是T的前部分【0,j】,那我们怎么得到后部分出现的次数呢?我们不能每次都枚举【j,lenT】。其实,可以将两个字符串反转,再用相同的处理方法处理,最后得到cnt2数组。最后进行计算,for (i = 1; i < len; ++i) ans += cnt[i] * cnt[len-i],还是挺容易理解的。
测试数据:
10
ab
abcd
代码:
#include <stdio.h> #include <string.h> #include <algorithm> using namespace std; #define MAX 210000 long long ans; int n,m,len1,len2; char s1[MAX],s2[MAX],s3[MAX],c; int next1[MAX],next2[MAX]; int cnt1[MAX],cnt2[MAX]; void GetNext(int *next,char *s2) { //获取s2的next数组 int i = 0,j = -1; next[i] = -1; while (i < len2) { if (j == -1 || s2[i] == s2[j]) i++,j++,next[i] = j; else j = next[j]; } } void Match(int *next,int *cnt) { //s2去匹配s1,并记录每个子串出现几次 int i = 0,j = 0; while (i < len1) { if (j == -1 || s1[i] == s2[j]) i++,j++,cnt[j]++; else j = next[j]; } for (i = len2; i >= 0; --i) if (next[i] != -1) cnt[next[i]] += cnt[i]; } void Reserve(char *s,int len) { //将字符串s反转 for (int i = 0; i < len / 2; ++i) c = s[i],s[i] = s[len-i-1],s[len-i-1] = c; } long long Solve() { //计算答案 for (int i = 1; i < len2; ++i) ans += (long long)cnt1[i] * cnt2[len2-i]; return ans; } int main() { int i,j,k,t; scanf("%d",&t); while (t--) { scanf("%s%s",s1,s2); len1 = strlen(s1); len2 = strlen(s2); memset(cnt1,0,sizeof(cnt1)); memset(cnt2,0,sizeof(cnt2)); GetNext(next1,s2); //s1拼到s2后面 Match(next1,cnt1); Reserve(s1,len1); Reserve(s2,len2); GetNext(next2,s2); Match(next2,cnt2); ans = 0,Solve(); printf("%lld\n",ans); } }
本文ZeroClock原创,但可以转载,因为我们是兄弟。