HDU 4644 BWT(Burrows–Wheeler transform+KMP)

 题目链接:http://acm.hdu.edu.cn/showproblem.php?pid=4644

题意:给出一个串,按照下面的步骤得到一个新串:

(1)首先将其后面增加一个美元符号;

(2)将每个后缀写下,并将前面的补在后面;

(3)排序;

(4)取下最后一列,得到新串。

现在给出新串。再给出一些串,问这些串是不是原串的子串。

HDU 4644 BWT(Burrows–Wheeler transform+KMP)_第1张图片

 

 

思路:首先,我们要做的就是还原原串。下面是题解给出的还原的方法:

HDU 4644 BWT(Burrows–Wheeler transform+KMP)_第2张图片

 

 

乍看上去是O(n^2logn)的!!其实有O(n)还原的方法。不过也是借助于上面的思路。对于上面得到的串gc$aaac为例,首先,为其编号0到6,那么排序后得到为:$aaaccg,编号为2345160(记为W)。我们想一下,以后每次排序得到的W和现在的都是一样的。想想,若首字母不同则显然,小的字母以后还是在前面,比如$开始的这个串一直排名第一;对于相同的字母,比如3个a,那么越靠前的a其后面补的字母越小,还是越靠前。因此,排名第一的串的第一个字母为2=a[0]位置的$;而第一轮补给2位置的为4=a[2]位置的a,第二轮跑到了0位置的串即$的后面。依次类推即可。

之后对于每个查询就是KMP匹配即可。


char s[N],S[N];
int n,a[N];


int cmp(int x,int y)
{
    if(s[x]==s[y]) return x<y;
    return s[x]<s[y];
}


int next[N];


int cal()
{
    next[0]=-1;
    int i=0,j=-1;
    int len=strlen(s);
    while(i<len)
    {
        if(j==-1||s[i]==s[j]) i++,j++;
        else j=next[j];
    }
    i=0,j=0;
    while(i<n)
    {
        if(j==-1||S[i]==s[j]) i++,j++;
        else j=next[j];
        if(j==len) return 1;
    }
    return 0;
}


int main()
{
    while(scanf("%s",s)!=-1)
    {
        n=strlen(s);
        int i;
        FOR0(i,n) a[i]=i;
        sort(a,a+n,cmp);
        int t=a[0];
        FOR0(i,n)
        {
            S[i]=s[t];
            t=a[t];
        }
        int m;
        RD(m);
        while(m--)
        {
            RD(s);
            if(cal()) puts("YES");
            else puts("NO");
        }
    }
}






你可能感兴趣的:(transform)