hdu 1403 后缀数组入门题

Longest Common Substring

Time Limit: 8000/4000 MS (Java/Others)    Memory Limit: 65536/32768 K (Java/Others)
Total Submission(s): 4227    Accepted Submission(s): 1597


Problem Description
Given two strings, you have to tell the length of the Longest Common Substring of them.

For example:
str1 = banana
str2 = cianaic

So the Longest Common Substring is "ana", and the length is 3.
 

Input
The input contains several test cases. Each test case contains two strings, each string will have at most 100000 characters. All the characters are in lower-case.

Process to the end of file.
 

Output
For each test case, you have to tell the length of the Longest Common Substring of them.
 

Sample Input
 
   
banana cianaic
 

Sample Output
 
   
3
 

Author
Ignatius.L

注意一下题目中的是'substring',不是subsequence。

题目的数据范围是100000,所以用平常的o(n^2)的算法会TLE。

选择后缀数组来进行操作。

考虑测试用例:banana,cianaic

后缀数组的一个常规操作就是将两个字符串接起来进行操作。

我们可以在两个字符串之间接上'$',那么我们构造出的height数组的最大值就是所求的答案。

那为什么我们要用'$'分开来?

1.'$'的ASCII码值比字母小(虽然这句话很逗,但是确实有人用了例如'|'的分隔符)

2.通过ASCII码值,我们可以起到分离两个字符串的效果,两个串的lcp是不可能越过分隔符的。

一些推广:如果有多个字符串要求lcs,那么连起来就可以了,当然,要注意分隔符。最好是取不一样的分隔符。

代码:

#include
#include
#include
#define N 200005
using namespace std;
int s[N],t1[N],t2[N],x[N],c[N],sa[N],rank[N],height[N];
char str[N];
void build_sa(int *s,int n,int m)
{
    int i,*x=t1,*y=t2,k;
    for(i=0;i=0;i--) sa[--c[x[i]]]=i;
    for(k=1;k<=n;k<<=1)
    {
        int p=0;
        for(i=n-k;i=k) y[p++]=sa[i]-k;
        for(i=0;i=0;i--)  sa[--c[x[y[i]]]]=y[i];
        swap(x,y);
        p=1; x[sa[0]]=0;
        for(i=1;i=n) break;
        m=p;
    }
}
void getheight(int n)
{
    int i,j,k=0;
    for(i=0;ians&&((sa[i-1]=len1)||(sa[i-1]>=len1&&sa[i]


你可能感兴趣的:(后缀数组)