【POJ】3693 Maximum repetition substring 【后缀数组——求最长连续重复字串】

传送门:【POJ】3693 Maximum repetition substring


题目分析:这个主要是看后缀数组的神论文了解的。。。。

对于枚举的长度L,如果存在连续重复子串,则对于s[0],s[L],s[2*L],……,来说,一定存在相邻两个s[i*L],s[i*L+L]使得lcp(i*L,i*L+L)>=0,此时设M=lcp(i*L,i*L+L),很显然存在一个重复次数为M/L+1的子串(M=0则重复次数为1)。但是从i*L开始并不一定是最优解,因为可能L不能整除M,所以此时我们将比较的位置向前移动L-M%L,使得没有比较过的L-M%L的部分也比较一次,设移动后的位置为x,则如果此时lcp(x,x+L)>=L,则说明又多出了一截匹配(之前已经有M%L匹配了,所以如果这L-M%L也匹配则说明又多出了一个重复段),此时我们得到一个重复次数为M/L+2的子串。

最后我们依次从sa排名小的串开始枚举,看是否能找到合法的,第一个合法的就是答案,因为sa排名小的就是字典序小的。


PS:参考了爱神的思路^_^,不然真的不会做T  T


代码如下:


#include <cstdio>
#include <vector>
#include <cstring>
#include <cmath>
#include <algorithm>
using namespace std ;

typedef long long LL ;

#define rep( i , a , b ) for ( int i = ( a ) ; i <  ( b ) ; ++ i )
#define For( i , a , b ) for ( int i = ( a ) ; i <= ( b ) ; ++ i )
#define rev( i , a , b ) for ( int i = ( a ) ; i >= ( b ) ; -- i )
#define clr( a , x ) memset ( a , x , sizeof a )
#define cpy( a , x ) memcpy ( a , x , sizeof a )

const int MAXN = 100005 ;

char s[MAXN] ;
int t1[MAXN] , t2[MAXN] , c[MAXN] , xy[MAXN] ;
int sa[MAXN] , height[MAXN] , rank[MAXN] ;
int dp[MAXN][18] ;
int S[MAXN] , top ;
int n ;

int cmp ( int *r , int a , int b , int d ) {
	return r[a] == r[b] && r[a + d] == r[b + d] ;
}

void getHeight ( int n , int k = 0 ) {
	For ( i , 0 , n ) rank[sa[i]] = i ;
	rep ( i , 0 , n ) {
		if ( k ) -- k ;
		int j = sa[rank[i] - 1] ;
		while ( s[i + k] == s[j + k] ) ++ k ;
		height[rank[i]] = k ;
	}
}

void da ( int n , int m = 128 ) {
	int *x = t1 , *y = t2 ;
	rep ( i , 0 , m ) c[i] = 0 ;
	rep ( i , 0 , n ) ++ c[x[i] = s[i]] ;
	rep ( i , 1 , m ) c[i] += c[i - 1] ;
	rev ( i , n - 1 , 0 ) sa[-- c[x[i]]] = i ;
	for ( int d = 1 , p = 0 ; p < n ; d <<= 1 , m = p ) {
		p = 0 ;
		rep ( i , n - d , n ) y[p ++] = i ;
		rep ( i , 0 , n ) if ( sa[i] >= d ) y[p ++] = sa[i] - d ;
		rep ( i , 0 , m ) c[i] = 0 ;
		rep ( i , 0 , n ) ++ c[xy[i] = x[y[i]]] ;
		rep ( i , 1 , m ) c[i] += c[i - 1] ;
		rev ( i , n - 1 , 0 ) sa[-- c[xy[i]]] = y[i] ;
		swap ( x , y ) ;
		p = 0 ;
		x[sa[0]] = p ++ ;
		rep ( i , 1 , n ) x[sa[i]] = cmp ( y , sa[i - 1] , sa[i] , d ) ? p - 1 : p ++ ;
	}
	getHeight ( n - 1 ) ;
}

void init_RMQ ( int n ) {
	For ( i , 1 , n ) dp[i][0] = height[i] ;
	for ( int j = 1 ; ( 1 << j ) < n ; ++ j ) {
		for ( int i = 1 ; i + ( 1 << j ) - 1 <= n ; ++ i ) {
			dp[i][j] = min ( dp[i][j - 1] , dp[i + ( 1 << ( j - 1 ) )][j - 1] ) ;
		}
	}
}

int rmq ( int L , int R , int k = 0 ) {
	while ( ( 1 << ( k + 1 ) ) <= R - L + 1 ) ++ k ;
	return min ( dp[L][k] , dp[R - ( 1 << k ) + 1][k] ) ;
}

int lcp ( int a , int b ) {
	a = rank[a] , b = rank[b] ;
	return a < b ? rmq ( a + 1 , b ) : rmq ( b + 1 , a ) ;
}

void solve () {
	int ans = 0 ;
	top = 0 ;
	n = strlen ( s ) ;
	da ( n + 1 ) ;
	init_RMQ ( n ) ;
	For ( l , 1 , n ) {
		for ( int i = 0 ; i < n ; i += l ) {
			int k = lcp ( i , i + l ) ;
			int t = k / l + 1 ;
			int x = i - ( l - k % l ) ;
			if ( x >= 0 && k % l && lcp ( x , x + l ) >= l ) ++ t ;
			if ( t > ans ) {
				ans = t ;
				top = 0 ;
				S[top ++] = l ;
			} else if ( t == ans ) S[top ++] = l ;
		}
	}
	For ( i , 1 , n ) {
		rep ( j , 0 , top ) {
			int l = S[j] ;
			int len = ans * l ;
			if ( lcp ( sa[i] , sa[i] + l ) >= len - l ) {
				rep ( k , sa[i] , sa[i] + len ) printf ( "%c" , s[k] ) ;
				printf ( "\n" ) ;
				return ;
			}
		}
	}
}

int main () {
	int cas = 0 ;
	while ( ~scanf ( "%s" , s ) && s[0] != '#' ) {
		printf ( "Case %d: " , ++ cas ) ;
		solve () ;
	}
	return 0 ;
}


你可能感兴趣的:(poj)