poj 3691 AC自动机+dp(修复DNA使其不带病毒)

题意:给定不超过50个由 ‘A’, ‘G’ , ‘C‘ ,’T’。 四个字母组成的模式串,每个模式串长度不超过 20,再给一个不超过1000个字符长的同样由上述字母组成的母串S, 问在S中至少要修改多 少个字符,才能使其不包含任何模式串。

思路:对模式串建立AC自动机。然后在其上进行动态规划。Ans[i][j]表示若要用长度为i的母串的前缀遍历DFA树, 使之达到节点 j ,至少要修改的字符数量。j 必须不是模式串的“危险”节点。
初始情况:Ans[0][1] = 0 //1是DFA的初始节点其他所有Ans[i][j] 为无穷大。

问题的答案就是Min{ Ans[len][j] | j 是DFA的安全节点 ,其中len是母串的长度}

状态转移方程为:由Ans[i][j] 可以推出:Ans[i+1][son[j]] = min { Ans[i+1][son[j]],Ans[i][j] + ( Char(j,son[j]) != str[i] ) }。Char(j,son[j])表示从节点j走到节点son[j]所经过的字母,str是母串,下标从0开始算。

#include <cstdio>
#include <cstring>
#include <algorithm>
#include <map>
#include <queue>
#include <cstdlib>
using namespace std;
#define INF 0x3fffffff
#define clc(s,t) memset(s,t,sizeof(s))
#define N 1005
int t[N][4],fail[N],dp[N][N];
char s[N];
bool flag[N];
int n,top,c=1;
map<char,int> h1;
map<int,char> h2;
void init(){
    clc(t,-1);
    clc(fail,0);
    clc(flag,false);
    for(int i = 0;i<4;i++)
        t[0][i] = 1;
    top = 1;
}
void insert(char* s){
    int i,r = 1;
    for(i = 0;s[i];i++){
        if(t[r][h1[s[i]]] == -1)
            t[r][h1[s[i]]] = (++top);
        r = t[r][h1[s[i]]];
    }
    flag[r] = true;
}
void buildDFA(){
    int i,now;
    queue<int> q;
    q.push(1);
    while(!q.empty()){
        now = q.front();
        q.pop();
        for(i = 0;i<4;i++){
            if(t[now][i] == -1)
                t[now][i] = t[fail[now]][i];
            else{
                fail[t[now][i]] = t[fail[now]][i];
                q.push(t[now][i]);
                if(flag[t[fail[now]][i]])
                    flag[t[now][i]] = true;
            }
        }
    }
}
int main(){
    h1['A'] = 0;
    h1['G'] = 1;
    h1['C'] = 2;
    h1['T'] = 3;
    h2[0] = 'A';
    h2[1] = 'G';
    h2[2] = 'C';
    h2[3] = 'T';
    while(scanf("%d",&n) && n){
        int i,j,k,len,res=INF;
        init();
        for(i = 1;i<=n;i++){
            scanf("%s",s);
            insert(s);
        }
        buildDFA();
        scanf("%s",s);
        len = (int)strlen(s);
        for(i = 0;i<=len;i++)
            for(j = 1;j<=top;j++)
                dp[i][j] = INF;
        dp[0][1] = 0;
        for(i = 0;i<len;i++)
            for(j = 1;j<=top;j++)
                for(k = 0;k<4;k++)
                    if(dp[i][j]!=INF && !flag[t[j][k]])
                        dp[i+1][t[j][k]] = min(dp[i+1][t[j][k]],dp[i][j]+(s[i]!=h2[k]));
        for(i = 1;i<=top;i++)
            res = min(res,dp[len][i]);
        printf("Case %d: %d\n",c++,res==INF?-1:res);
    }
    return 0;
}


你可能感兴趣的:(poj 3691 AC自动机+dp(修复DNA使其不带病毒))