POJ 3294 Life Forms(后缀数组+二分)

Description
给出n个串,求至少出现在n/2+1个串中的最长公共子串
Input
多组用例,每组用例第一行为一整数n(1<=n<=100)表示串的数量,之后n行为n个串长不超过1000的字符串,以n=0结束输入
Output
对于每组用例,输出所有满足条件的最长公共子串(字典序从小到大输出),如果不存在满足条件的子串则输出?,相邻两组输出间用一空行隔开
Sample Input
3
abcdefg
bcdefgh
cdefghi
3
xxx
yyy
zzz
0
Sample Output
bcdefg
cdefgh

?
Solution
类似找n个串的最长公共子串,将这n个串连在一起,相邻两串之间用隔离字符隔离开以避免匹配越界,用id数组记录每个字符所属串的编号,求完height数组后二分最长长度,对于每个二分值k,对height数组分组,标记每组的id[sa[i]]值,如果被标记的id值超过n/2则符合条件,记录sa[i-1]表示以第sa[i-1]个字符为首字符,长度为k的子串符合条件,注意此时遇见可行解也不能退出,而是标记有解后继续判断其他组是否存在符合条件的解,这样记录的解是有字典序的,不需要排序就可以输出
Code

#include<cstdio>
#include<iostream>
#include<cstring>
#include<algorithm>
using namespace std;
#define maxn 111111
int t1[maxn],t2[maxn],c[maxn],sa[maxn],rank[maxn],height[maxn];
bool cmp(int *r,int a,int b,int l)
{
    return r[a]==r[b]&&r[a+l]==r[b+l];
}
void da(int str[],int n,int m)
{
    n++;
    int i,j,p,*x=t1,*y=t2;
    for(i=0;i<m;i++)c[i]=0;
    for(i=0;i<n;i++)c[x[i]=str[i]]++;
    for(i=1;i<m;i++)c[i]+=c[i-1];
    for(i=n-1;i>=0;i--)sa[--c[x[i]]]=i;
    for(j=1;j<=n;j<<=1)
    {
        p=0;
        for(i=n-j;i<n;i++)y[p++]=i;
        for(i=0;i<n;i++)if(sa[i]>=j)y[p++]=sa[i]-j;
        for(i=0;i<m;i++)c[i]=0;
        for(i=0;i<n;i++)c[x[y[i]]]++;
        for(i=1;i<m;i++)c[i]+=c[i-1];
        for(i=n-1;i>=0;i--)sa[--c[x[y[i]]]]=y[i];
        swap(x,y);
        p=1;x[sa[0]]=0;
        for(i=1;i<n;i++)
        x[sa[i]]=cmp(y,sa[i-1],sa[i],j)?p-1:p++;
        if(p>=n)break;
        m=p;
    }
    int k=0;
    n--;
    for(i=0;i<=n;i++)rank[sa[i]]=i;
        for(i=0;i<n;i++)
        {
            if(k)k--;
            j=sa[rank[i]-1];
            while(str[i+k]==str[j+k])k++;
            height[rank[i]]=k;
        }
}
int n,res,a[maxn],id[maxn],vis[111],ans[maxn],ansnum;
char s[1111];
int check(int k)
{
    int cnt=0,temp=0;
    memset(vis,0,sizeof(vis));
    for(int i=2;i<=res;i++)
    {
        if(height[i]<k)
        {
            if(cnt>n/2)ans[++temp]=sa[i-1];
            memset(vis,0,sizeof(vis));
            cnt=0;
            continue;
        }
        if(!vis[id[sa[i-1]]])
            vis[id[sa[i-1]]]=1,cnt++;
        if(!vis[id[sa[i]]])
            vis[id[sa[i]]]=1,cnt++;
    }
    if(cnt>n/2)ans[++temp]=sa[n];
    if(temp)
    {
        ans[0]=temp;
        return 1;
    }
    return 0;
}
int main()
{
    int mark=0;
    while(~scanf("%d",&n),n)
    {
        res=0;
        for(int i=0;i<n;i++)
        {
            scanf("%s",s);
            int len=strlen(s);
            for(int j=0;j<len;j++)
                a[res]=s[j],id[res++]=i;
            a[res]='#'+i;
            id[res++]='#'+i;
        }
        a[res]=0;
        da(a,res,200);
        int l=1,r=res,flag=0;
        while(l<=r) 
        {
            int mid=(l+r)>>1;
            if(check(mid))
            {
                flag=1;
                l=mid+1;
            }
            else r=mid-1;
        }
        if(mark)printf("\n");
        mark=1;
        if(flag)
        {
            for(int i=1;i<=ans[0];i++)
            {
                for(int j=ans[i];j<ans[i]+l-1;j++)
                    printf("%c",a[j]);
                printf("\n");
            }
        }
        else printf("?\n");
    }
    return 0;
}

你可能感兴趣的:(POJ 3294 Life Forms(后缀数组+二分))