hdu 4436 str2int (后缀自动机)

hdu 4436 str2int (后缀自动机)

题意:给出n个数字,数字很长,用字符串读入,长度总和为10^5。求这n个字符串的所有子串(不重复)的和取模2012 。

解题思路:后缀自动机。。因为要处理所有不同的子串,所以想到后缀自动机。将所有的串一个个建进去,用一个10去间隔开来。建好之后,我们要统计和了。后缀自动机有这样一个性质,从s出发,到达所有节点的路径的集合,即所有该串的不相同的子串的集合(这个性质为什么我就不详细解释了,想详细了解的可以找我详细讨论,我也加深下理解),还有另一个性质,父亲的代表串的长度比儿子短(显而易见,不解释了)。利用第一个性质,我们记录节点的sum[u]表示到u节点的所有子串的和,那么对于u下面一个能到达的节点v,sum[v] = sum[u] * 10 + cnt[u] * k  (cnt[u] 表示到达u的路径数,因为任意一条路径都可以再添上一个k,所以用cnt[u] * k),cnt 的维护就是从父亲累加过来了。所有节点的sum求完之后,累加即答案。一开始我是用的广搜,从根开始,如果有儿子就往儿子更新。但是这样是不对的,有可能儿子的代表串的长度并不是len[u] +1啊,当你将儿子加入到更新队列中时,此时它的信息并不完整,因此我们根据第二个性质,给节点排序,父亲在前。这样的话,就可以保证你要用v向下更新时,它的信息已经是真实的了。

后缀自动机,不错的数据结构,代码简短,效率高:

#pragma comment(linker, "/STACK:1024000000,1024000000")
#include<stdio.h>
#include<string.h>
#include<algorithm>
#include<queue>
using namespace std ;

const int maxn = 111111 ;
int ans ;
int sum[maxn<<1] , cnt[maxn<<1] ;
int pos[maxn<<1] ;
int c[11][maxn<<1] , fa[maxn<<1] , val[maxn<<1] ;
int tot , last ;

bool cmp ( int i , int j ) {
	return val[i] < val[j] ;
}

struct sam {

	int new_node ( int step ) {
		int i ;
		val[++tot] = step ;
		for ( i = 0 ; i < 11 ; i ++ ) c[i][tot] = 0 ;
		fa[tot] = 0 ;
		return tot ;
	}

	void add ( int k ) {
		int p = last , i ;
		int np = new_node ( val[p] + 1 ) ;
		while ( p && !c[k][p] ) c[k][p] = np , p = fa[p] ;
		if ( !p ) fa[np] = 1 ;
		else {
			int q = c[k][p] ;
			if ( val[p] + 1 == val[q] ) fa[np] = q ;
			else {
				int nq = new_node ( val[p] + 1 ) ;
				for ( i = 0 ; i < 11 ; i ++ ) c[i][nq] = c[i][q] ;
				fa[nq] = fa[q] ;
				fa[q] = fa[np] = nq ;
				while ( p && c[k][p] == q ) c[k][p] = nq , p = fa[p] ;
			}
		}
		last = np ;
	}

	void init () {
		tot = 0 ;
		last = new_node ( 0 ) ;
	}

	void solve () {
		int i , j ;
		for ( i = 1 ; i <= tot ; i ++ ) pos[i] = i ;
		sort ( pos + 1 , pos + tot + 1 , cmp ) ;
		for ( i = 1 ; i <= tot ; i ++ ) {
			int u = pos[i] ;
	//		printf ( "dp[%d] = %d , cnt[%d] = %d\n" , u , sum[u] , u , cnt[u] ) ;
			for ( j = 0 ; j < 10 ; j ++ ) {
				if ( u == 1 && j == 0 ) continue ;
				if ( !c[j][u] ) continue ;
				int v = c[j][u] ;
				int add = ( sum[u] * 10 + j * cnt[u] ) % 2012 ;
				sum[v] = ( sum[v] + add ) % 2012 ;
				cnt[v] += cnt[u] ;
//				printf ( "dp[%d] = %d , cnt[%d] = %d\n" , v , sum[v] , v , cnt[v] ) ;
			}
		}
		for ( i = 1 ; i <= tot ; i ++ ) ans = ( ans + sum[i] ) % 2012 ;
	}

} suf ;
char s[maxn] ;
int main () {
	int n , i ;
	while ( scanf ( "%d" , &n ) != EOF ) {
		suf.init () ;
		ans = 0 ;
		memset ( sum , 0 , sizeof ( sum ) ) ;
		memset ( cnt , 0 , sizeof ( cnt ) ) ;
		cnt[1] = 1 ;
		while ( n -- ) {
			scanf ( "%s" , s ) ;
			int len = strlen ( s ) ;
			for ( i = 0 ; i < len ; i ++ )
				suf.add ( s[i] - '0' ) ;
			suf.add ( 10 ) ;
		}
		suf.solve () ;
		printf ( "%d\n" , ans ) ;
	}
}
/*
4
62
0000
411
164

782
*/


你可能感兴趣的:(后缀自动机)