传送门:【POJ】3693 Maximum repetition substring
题目分析:这个主要是看后缀数组的神论文了解的。。。。
对于枚举的长度L,如果存在连续重复子串,则对于s[0],s[L],s[2*L],……,来说,一定存在相邻两个s[i*L],s[i*L+L]使得lcp(i*L,i*L+L)>=0,此时设M=lcp(i*L,i*L+L),很显然存在一个重复次数为M/L+1的子串(M=0则重复次数为1)。但是从i*L开始并不一定是最优解,因为可能L不能整除M,所以此时我们将比较的位置向前移动L-M%L,使得没有比较过的L-M%L的部分也比较一次,设移动后的位置为x,则如果此时lcp(x,x+L)>=L,则说明又多出了一截匹配(之前已经有M%L匹配了,所以如果这L-M%L也匹配则说明又多出了一个重复段),此时我们得到一个重复次数为M/L+2的子串。
最后我们依次从sa排名小的串开始枚举,看是否能找到合法的,第一个合法的就是答案,因为sa排名小的就是字典序小的。
PS:参考了爱神的思路^_^,不然真的不会做T T
代码如下:
#include <cstdio> #include <vector> #include <cstring> #include <cmath> #include <algorithm> using namespace std ; typedef long long LL ; #define rep( i , a , b ) for ( int i = ( a ) ; i < ( b ) ; ++ i ) #define For( i , a , b ) for ( int i = ( a ) ; i <= ( b ) ; ++ i ) #define rev( i , a , b ) for ( int i = ( a ) ; i >= ( b ) ; -- i ) #define clr( a , x ) memset ( a , x , sizeof a ) #define cpy( a , x ) memcpy ( a , x , sizeof a ) const int MAXN = 100005 ; char s[MAXN] ; int t1[MAXN] , t2[MAXN] , c[MAXN] , xy[MAXN] ; int sa[MAXN] , height[MAXN] , rank[MAXN] ; int dp[MAXN][18] ; int S[MAXN] , top ; int n ; int cmp ( int *r , int a , int b , int d ) { return r[a] == r[b] && r[a + d] == r[b + d] ; } void getHeight ( int n , int k = 0 ) { For ( i , 0 , n ) rank[sa[i]] = i ; rep ( i , 0 , n ) { if ( k ) -- k ; int j = sa[rank[i] - 1] ; while ( s[i + k] == s[j + k] ) ++ k ; height[rank[i]] = k ; } } void da ( int n , int m = 128 ) { int *x = t1 , *y = t2 ; rep ( i , 0 , m ) c[i] = 0 ; rep ( i , 0 , n ) ++ c[x[i] = s[i]] ; rep ( i , 1 , m ) c[i] += c[i - 1] ; rev ( i , n - 1 , 0 ) sa[-- c[x[i]]] = i ; for ( int d = 1 , p = 0 ; p < n ; d <<= 1 , m = p ) { p = 0 ; rep ( i , n - d , n ) y[p ++] = i ; rep ( i , 0 , n ) if ( sa[i] >= d ) y[p ++] = sa[i] - d ; rep ( i , 0 , m ) c[i] = 0 ; rep ( i , 0 , n ) ++ c[xy[i] = x[y[i]]] ; rep ( i , 1 , m ) c[i] += c[i - 1] ; rev ( i , n - 1 , 0 ) sa[-- c[xy[i]]] = y[i] ; swap ( x , y ) ; p = 0 ; x[sa[0]] = p ++ ; rep ( i , 1 , n ) x[sa[i]] = cmp ( y , sa[i - 1] , sa[i] , d ) ? p - 1 : p ++ ; } getHeight ( n - 1 ) ; } void init_RMQ ( int n ) { For ( i , 1 , n ) dp[i][0] = height[i] ; for ( int j = 1 ; ( 1 << j ) < n ; ++ j ) { for ( int i = 1 ; i + ( 1 << j ) - 1 <= n ; ++ i ) { dp[i][j] = min ( dp[i][j - 1] , dp[i + ( 1 << ( j - 1 ) )][j - 1] ) ; } } } int rmq ( int L , int R , int k = 0 ) { while ( ( 1 << ( k + 1 ) ) <= R - L + 1 ) ++ k ; return min ( dp[L][k] , dp[R - ( 1 << k ) + 1][k] ) ; } int lcp ( int a , int b ) { a = rank[a] , b = rank[b] ; return a < b ? rmq ( a + 1 , b ) : rmq ( b + 1 , a ) ; } void solve () { int ans = 0 ; top = 0 ; n = strlen ( s ) ; da ( n + 1 ) ; init_RMQ ( n ) ; For ( l , 1 , n ) { for ( int i = 0 ; i < n ; i += l ) { int k = lcp ( i , i + l ) ; int t = k / l + 1 ; int x = i - ( l - k % l ) ; if ( x >= 0 && k % l && lcp ( x , x + l ) >= l ) ++ t ; if ( t > ans ) { ans = t ; top = 0 ; S[top ++] = l ; } else if ( t == ans ) S[top ++] = l ; } } For ( i , 1 , n ) { rep ( j , 0 , top ) { int l = S[j] ; int len = ans * l ; if ( lcp ( sa[i] , sa[i] + l ) >= len - l ) { rep ( k , sa[i] , sa[i] + len ) printf ( "%c" , s[k] ) ; printf ( "\n" ) ; return ; } } } } int main () { int cas = 0 ; while ( ~scanf ( "%s" , s ) && s[0] != '#' ) { printf ( "Case %d: " , ++ cas ) ; solve () ; } return 0 ; }