题意:给定不超过50个由 ‘A’, ‘G’ , ‘C‘ ,’T’。 四个字母组成的模式串,每个模式串长度不超过 20,再给一个不超过1000个字符长的同样由上述字母组成的母串S, 问在S中至少要修改多 少个字符,才能使其不包含任何模式串。
思路:对模式串建立AC自动机。然后在其上进行动态规划。Ans[i][j]表示若要用长度为i的母串的前缀遍历DFA树, 使之达到节点 j ,至少要修改的字符数量。j 必须不是模式串的“危险”节点。
初始情况:Ans[0][1] = 0 //1是DFA的初始节点其他所有Ans[i][j] 为无穷大。
问题的答案就是Min{ Ans[len][j] | j 是DFA的安全节点 ,其中len是母串的长度}
状态转移方程为:由Ans[i][j] 可以推出:Ans[i+1][son[j]] = min { Ans[i+1][son[j]],Ans[i][j] + ( Char(j,son[j]) != str[i] ) }。Char(j,son[j])表示从节点j走到节点son[j]所经过的字母,str是母串,下标从0开始算。
#include <cstdio> #include <cstring> #include <algorithm> #include <map> #include <queue> #include <cstdlib> using namespace std; #define INF 0x3fffffff #define clc(s,t) memset(s,t,sizeof(s)) #define N 1005 int t[N][4],fail[N],dp[N][N]; char s[N]; bool flag[N]; int n,top,c=1; map<char,int> h1; map<int,char> h2; void init(){ clc(t,-1); clc(fail,0); clc(flag,false); for(int i = 0;i<4;i++) t[0][i] = 1; top = 1; } void insert(char* s){ int i,r = 1; for(i = 0;s[i];i++){ if(t[r][h1[s[i]]] == -1) t[r][h1[s[i]]] = (++top); r = t[r][h1[s[i]]]; } flag[r] = true; } void buildDFA(){ int i,now; queue<int> q; q.push(1); while(!q.empty()){ now = q.front(); q.pop(); for(i = 0;i<4;i++){ if(t[now][i] == -1) t[now][i] = t[fail[now]][i]; else{ fail[t[now][i]] = t[fail[now]][i]; q.push(t[now][i]); if(flag[t[fail[now]][i]]) flag[t[now][i]] = true; } } } } int main(){ h1['A'] = 0; h1['G'] = 1; h1['C'] = 2; h1['T'] = 3; h2[0] = 'A'; h2[1] = 'G'; h2[2] = 'C'; h2[3] = 'T'; while(scanf("%d",&n) && n){ int i,j,k,len,res=INF; init(); for(i = 1;i<=n;i++){ scanf("%s",s); insert(s); } buildDFA(); scanf("%s",s); len = (int)strlen(s); for(i = 0;i<=len;i++) for(j = 1;j<=top;j++) dp[i][j] = INF; dp[0][1] = 0; for(i = 0;i<len;i++) for(j = 1;j<=top;j++) for(k = 0;k<4;k++) if(dp[i][j]!=INF && !flag[t[j][k]]) dp[i+1][t[j][k]] = min(dp[i+1][t[j][k]],dp[i][j]+(s[i]!=h2[k])); for(i = 1;i<=top;i++) res = min(res,dp[len][i]); printf("Case %d: %d\n",c++,res==INF?-1:res); } return 0; }