【POJ】2774 Long Long Message 后缀数组

传送门:【POJ】2774 Long Long Message


题目分析:后缀数组入门题。终于开始学后缀数组了。。。鸡排(基数排序)一开始不会导致学了好久。。。

这题是将两个串并到一个串上,中间用一个特殊符号隔开(一般用'$'),然后在串的末尾加一个0,这样构造后缀数组的时候便不需要特殊判断了。

求出height数组后,由于height[i]为第i小的后缀和第i-1小的后缀的最长公共前缀(LCP),而且最优解一定在两相邻中串的LCP中得出,只要第i小和第i-1小的不是同一个串中的后缀,则这个LCP的值可以用来更新最大值。


代码如下:

#include <cstdio>
#include <cstring>
#include <algorithm>
using namespace std ;

typedef long long LL ;

#define rep( i , a , b ) for ( int i = ( a ) ; i <  ( b ) ; ++ i )
#define For( i , a , b ) for ( int i = ( a ) ; i <= ( b ) ; ++ i )
#define rev( i , a , b ) for ( int i = ( a ) ; i >= ( b ) ; -- i )
#define clr( a , x ) memset ( a , x , sizeof a )
#define cpy( a , x ) memcpy ( a , x , sizeof a )

const int MAXN = 200005 ;

char s1[MAXN] , s2[MAXN] ;
int s[MAXN] ;
int t1[MAXN] , t2[MAXN] , c[MAXN] , xy[MAXN] ;
int sa[MAXN] , rank[MAXN] , height[MAXN] ;

//sa[i]表示排第i的是哪个后缀(sa[0]=n)
//rank[i]表示第i个后缀排第几(rank[n]=0)
//height[i]表示排第i的后缀和排第i-1的后缀的最长公共前缀(LCP)的长度
//rank[i]和sa[i]互为逆运算

int cmp ( int *r , int a , int b , int d ) {
	return r[a] == r[b] && r[a + d] == r[b + d] ;
}

void getHeight ( int n , int k = 0 ) {//得到排第i的后缀和排第i-1的后缀的最长公共前缀(LCP)的长度
	//因为有height[i]>=height[i - 1]-1所以可以O(N)求height[i]
	For ( i , 0 , n ) rank[sa[i]] = i ;//用sa线性求rank
	rep ( i , 0 , n ) {
		if ( k ) -- k ;
		int j = sa[rank[i] - 1] ;
		while ( s[i + k] == s[j + k] ) ++ k ;
		height[rank[i]] = k ;
	}
}

void da ( int n , int m = 30 ) {//初始m要比s[i]的最大值还大
	int *x = t1 , *y = t2 ;
	//y[i]为第二关键字有序下排第i的后缀
	//x[i]为第一关键字有序下且第一关键字相同时第二关键字有序下排第i的后缀
	//第一次基数排序时所有后缀的第二关键字均相同(无可比性)且y[i]=i
	rep ( i , 0 , m ) c[i] = 0 ;
	rep ( i , 0 , n ) ++ c[x[i] = s[i]] ;
	rep ( i , 1 , m ) c[i] += c[i - 1] ;
	rev ( i , n - 1 , 0 ) sa[-- c[x[i]]] = i ;//稳定排序,排第c[x[i]]-1的后缀为y[i](此时y[i]=i)
	for ( int d = 1 , p = 0 ; p < n ; d <<= 1 , m = p ) {
		p = 0 ;
		rep ( i , n - d , n ) y[p ++] = i ;//第二关键字为0的放到最前
		rep ( i , 0 , n ) if ( sa[i] >= d ) y[p ++] = sa[i] - d ;
		//根据第二关键字将对应的后缀排序,第i个后缀的第二关键字为i+d位置的上一次排序的排名,也就是sa[i]
		rep ( i , 0 , n ) xy[i] = x[y[i]] ;//将数组套数组变成数组可以加速
		//x[y[i]]表示第二关键字下排名为y[i]的后缀的第一关键字为x[y[i]]
		rep ( i , 0 , m ) c[i] = 0 ;
		rep ( i , 0 , n ) ++ c[xy[i]] ;
		rep ( i , 1 , m ) c[i] += c[i - 1] ;
		rev ( i , n - 1 , 0 ) sa[-- c[xy[i]]] = y[i] ;//稳定排序,排第c[xy[i]]-1的后缀为y[i]
		swap ( x , y ) ;//交换指针实现数组的交换,加速
		p = 1 ;
		x[sa[0]] = 0 ;//sa[0]=n-1(此时的n为字符串长度+1)
		rep ( i , 1 , n ) x[sa[i]] = cmp ( y , sa[i - 1] , sa[i] , d ) ? p - 1 : p ++ ;//根据关键字确定排名
	}
	getHeight ( n - 1 ) ;
}

int check ( int i , int len ) {//不是同一个串中的后缀返回1,否则返回0
	return sa[i] < len && sa[i - 1] > len || sa[i] > len && sa[i - 1] < len ;
}

void solve () {
	int n1 = strlen ( s1 ) ;
	int n2 = strlen ( s2 ) ;
	int n = n1 + 1 + n2 ;
	rep ( i , 0 , n1 ) s[i] = s1[i] - 'a' + 2 ;
	s[n1] = 1 ;
	rep ( i , 0 , n2 ) s[i + n1 + 1] = s2[i] - 'a' + 2 ;
	s[n] = 0 ;
	da ( n + 1 ) ;//注意传入的是n+1
	int maxv = 0 ;
	For ( i , 2 , n ) if ( height[i] > maxv && check ( i , n1 ) ) maxv = height[i] ;
	printf ( "%d\n" , maxv ) ;
}

int main () {
	while ( ~scanf ( "%s%s" , s1 , s2 ) ) solve () ;
	return 0 ;
}


你可能感兴趣的:(poj)