【POJ】3415 Common Substrings 【后缀数组+单调栈】

传送门:【POJ】3415 Common Substrings


题目分析:

题目要求的实质是计算 A 的所有后缀和 B 的所有后缀之间的最长公共前缀的长度,然后把最长公共前缀长度不小于 k 的部分全部加起来(即A的后缀ai和B的后缀bj的最长公共前缀为x且x大于等于k,则答案累加上x-k+1)。

由于枚举所有ai和bj的话是O(n^2)的复杂度,所以我们需要一些技巧来优化。

比较好的方法是单调栈。

首先将两个串连接到一起,中间用'$'隔开。然后构造后缀数组。

然后我们遍历height[i],求A的每一个后缀和在其之前的所有B的后缀对答案的贡献。由LCP的性质得后缀i和后缀j的最长公共前缀长度为i+1~j中height的最小值,如果i+1~j上所有的B的后缀和后缀A的LCP相同,那么我们将他们缩成一块,记录个数以及高度即可。那么这样我们就得到了一块块的B后缀。使其为升序,保证单调,那么新加入一个高度时我们就向前缩块直到该高度比之前的块的高度大位置,同时所有的B后缀的个数都累加到这个块中,且如果sa[i - 1]为B后缀时我们额外的+1。然后此时如果sa[i]为A后缀,那么在这个A后缀之前的所有B后缀对其的贡献为每一块的个数*(每一块的高度-k+1)的和,为了快速的到答案,我们保存前缀和。

最后我们倒过来求一次B的每一个后缀和在其之前的所有A的后缀对答案的贡献

这样所有的情况便都考虑到了。


这个思想甚妙啊!


代码如下:


#include 
#include 
#include 
using namespace std ;

typedef long long LL ;

#define rep( i , a , b ) for ( int i = ( a ) ; i <  ( b ) ; ++ i )
#define For( i , a , b ) for ( int i = ( a ) ; i <= ( b ) ; ++ i )
#define rev( i , a , b ) for ( int i = ( a ) ; i >= ( b ) ; -- i )
#define clr( a , x ) memset ( a , x , sizeof a )
#define cpy( a , x ) memcpy ( a , x , sizeof a )

const int MAXN = 200005 ;

struct Node {
	int height , cnt ;
	LL sum ;
} ;

Node S[MAXN] ;
char s[MAXN] ;
int t1[MAXN] , t2[MAXN] , c[MAXN] , xy[MAXN] ;
int sa[MAXN] , rank[MAXN] , height[MAXN] ;
int k ;

int cmp ( int *r , int a , int b , int d ) {
	return r[a] == r[b] && r[a + d] == r[b + d] ;
}

void getHeight ( int n , int k = 0 ) {
	For ( i , 0 , n ) rank[sa[i]] = i ;
	rep ( i , 0 , n ) {
		if ( k ) -- k ;
		int j = sa[rank[i] - 1] ;
		while ( s[i + k] == s[j + k] ) ++ k ;
		height[rank[i]] = k ;
	}
}

void da ( int n , int m = 128 ) {
	int i , d , p , *x = t1 , *y = t2 , *t ;
	for ( i = 0 ; i < m ; ++ i ) c[i] = 0 ;
	for ( i = 0 ; i < n ; ++ i ) ++ c[x[i] = s[i]] ;
	for ( i = 1 ; i < m ; ++ i ) c[i] += c[i - 1] ;
	for ( i = n - 1 ; i >= 0 ; -- i ) sa[-- c[x[i]]] = i ;
	for ( d = 1 , p = 0 ; p < n ; d <<= 1 , m = p ) {
		for ( i = n - d , p = 0 ; i < n ; ++ i ) y[p ++] = i ;
		for ( i = 0 ; i < n ; ++ i ) if ( sa[i] >= d ) y[p ++] = sa[i] - d ;
		for ( i = 0 ; i < m ; ++ i ) c[i] = 0 ;
		for ( i = 0 ; i < n ; ++ i ) ++ c[xy[i] = x[y[i]]] ;
		for ( i = 1 ; i < m ; ++ i ) c[i] += c[i - 1] ;
		for ( i = n - 1 ; i >= 0 ; -- i ) sa[-- c[xy[i]]] = y[i] ;
		for ( t = x , x = y , y = t , p = 0 , x[sa[0]] = p ++ , i = 1 ; i < n ; ++ i ) {
			x[sa[i]] = cmp ( y , sa[i - 1] , sa[i] , d ) ? p - 1 : p ++ ;
		}
	}
	getHeight ( n - 1 ) ;
}

void solve () {
	int n1 , n2 , n ;
	LL ans = 0 ;
	scanf ( "%s" , s ) ;
	n1 = strlen ( s ) ;
	s[n1] = '$' ;
	scanf ( "%s" , s + n1 + 1 ) ;
	n2 = strlen ( s + n1 + 1 ) ;
	n = n1 + 1 + n2 ;
	da ( n + 1 ) ;
	int top = 0 ;
	For ( i , 2 , n ) {
		if ( height[i] < k ) top = 0 ;
		else {
			int cnt = 0 ;
			while ( top && height[i] <= S[top - 1].height ) cnt += S[-- top].cnt ;
			S[top].cnt = cnt + ( sa[i - 1] > n1 ) ;
			S[top].height = height[i] ;
			S[top].sum = top ? S[top - 1].sum : 0 ;
			S[top].sum += ( LL ) ( S[top].height - k + 1 ) * S[top].cnt ;
			if ( sa[i] < n1 ) ans += S[top].sum ;
			top ++ ;
		}
	}
	top = 0 ;
	For ( i , 2 , n ) {
		if ( height[i] < k ) top = 0 ;
		else {
			int cnt = 0 ;
			while ( top && height[i] <= S[top - 1].height ) cnt += S[-- top].cnt ;
			S[top].cnt = cnt + ( sa[i - 1] < n1 ) ;
			S[top].height = height[i] ;
			S[top].sum = top ? S[top - 1].sum : 0 ;
			S[top].sum += ( LL ) ( S[top].height - k + 1 ) * S[top].cnt ;
			if ( sa[i] > n1 ) ans += S[top].sum ;
			top ++ ;
		}
	}
	printf ( "%lld\n" , ans ) ;
}

int main () {
	while ( ~scanf ( "%d" , &k ) && k ) solve () ;
	return 0 ;
}


你可能感兴趣的:(后缀数组【SA】)