Alice's Classified Message HDU - 5558 后缀自动机求某个后缀出现的最早位置

题意:

给定一个长度不超过 10W 的只包含小写字母的字符串,从下标 0 到 n−1。从下标 0 开始操作,

每次对于下标 pos查找下标 pos 开始的子串中最长的在其他地方出现过的长度,
其他出现的位置要求起点在位置 pos 之前,然后 pos 移动到这个长度之后继续操作;
如果没有这样的最长串儿就直接 pos++,继续操作,直到 pos=n 结束。

对于上述两种操作,前者输出最大长度 K 以及这种串儿最左边出现的位置;
后者输出 −1 和 s[pos] 的 ASCII码值。

精炼一下题意:就是求出以下标 i 开头的后缀 与【0,i-1】开头的后缀的最长公共前缀

题解:

在线建立后缀自动机,然后将在线匹配即可

然后记录一下对应节点的right集合的最小值就是 某个后缀出现的最早位置

然后L[ i ] - maxlen 就是最早的位置

 

  1 #include <set>
  2 #include 
  3 #include 
  4 #include 
  5 #include 
  6 #include 
  7 #include 
  8 #include <string>
  9 #include 
 10 #include 
 11 #include 
 12 #include 
 13 #include 
 14 
 15 #define  pi    acos(-1.0)
 16 #define  eps   1e-9
 17 #define  fi    first
 18 #define  se    second
 19 #define  rtl   rt<<1
 20 #define  rtr   rt<<1|1
 21 #define  bug                printf("******\n")
 22 #define  mem(a, b)          memset(a,b,sizeof(a))
 23 #define  name2str(x)        #x
 24 #define  fuck(x)            cout<<#x" = "< 25 #define  sfi(a)             scanf("%d", &a)
 26 #define  sffi(a, b)         scanf("%d %d", &a, &b)
 27 #define  sfffi(a, b, c)     scanf("%d %d %d", &a, &b, &c)
 28 #define  sffffi(a, b, c, d) scanf("%d %d %d %d", &a, &b, &c, &d)
 29 #define  sfL(a)             scanf("%lld", &a)
 30 #define  sffL(a, b)         scanf("%lld %lld", &a, &b)
 31 #define  sfffL(a, b, c)     scanf("%lld %lld %lld", &a, &b, &c)
 32 #define  sffffL(a, b, c, d) scanf("%lld %lld %lld %lld", &a, &b, &c, &d)
 33 #define  sfs(a)             scanf("%s", a)
 34 #define  sffs(a, b)         scanf("%s %s", a, b)
 35 #define  sfffs(a, b, c)     scanf("%s %s %s", a, b, c)
 36 #define  sffffs(a, b, c, d) scanf("%s %s %s %s", a, b,c, d)
 37 #define  FIN                freopen("../in.txt","r",stdin)
 38 #define  gcd(a, b)          __gcd(a,b)
 39 #define  lowbit(x)          x&-x
 40 #define  IO                 iOS::sync_with_stdio(false)
 41 
 42 
 43 using namespace std;
 44 typedef long long LL;
 45 typedef unsigned long long ULL;
 46 const ULL seed = 13331;
 47 const LL INFLL = 0x3f3f3f3f3f3f3f3fLL;
 48 const int maxm = 8e6 + 10;
 49 const int INF = 0x3f3f3f3f;
 50 const int mod = 2012;
 51 const int maxn = 1e6 + 7;
 52 
 53 struct Suffix_Automaton {
 54     int last, tot, nxt[maxn << 1][26], fail[maxn << 1];//last是未加入此字符前最长的前缀(整个串)所属的节点的编号
 55     int len[maxn << 1];// 最长子串的长度 (该节点子串数量 = len[x] - len[fa[x]])
 56     int sz[maxn << 1];// 被后缀链接的个数,方便求节点字符串的个数
 57     LL num[maxn << 1];// 该状态子串的数量
 58     LL maxx[maxn << 1];// 长度为x的子串出现次数最多的子串的数目
 59     LL sum[maxn << 1];// 该节点后面所形成的自字符串的总数
 60     LL subnum, sublen;// subnum表示不同字符串数目,sublen表示不同字符串总长度
 61     int X[maxn << 1], Y[maxn << 1]; // Y表示排名为x的节点,X表示该长度前面还有多少个
 62     int minn[maxn << 1], mx[maxn << 1];//minn[i]表示多个串在后缀自动机i节点最长公共子串,mx[i]表示单个串的最长公共子串
 63     int L[maxn << 1];
 64 
 65     void init() {
 66         tot = last = 1;
 67         fail[1] = len[1] = 0;
 68         for (int i = 0; i < 26; i++) nxt[1][i] = 0;
 69     }
 70 
 71     void extend(int c) {
 72         int u = ++tot, v = last;
 73         for (int i = 0; i <= 25; i++) nxt[u][i] = 0;
 74         fail[u] = 0;
 75         L[u] = len[u] = len[v] + 1;
 76         num[u] = 1;
 77         for (; v && !nxt[v][c]; v = fail[v]) nxt[v][c] = u;
 78         if (!v) fail[u] = 1, sz[1]++;
 79         else if (len[nxt[v][c]] == len[v] + 1) fail[u] = nxt[v][c], sz[nxt[v][c]]++;
 80         else {
 81             int now = ++tot, cur = nxt[v][c];
 82             len[now] = len[v] + 1;
 83             L[now] = L[cur];
 84             memcpy(nxt[now], nxt[cur], sizeof(nxt[cur]));
 85             fail[now] = fail[cur];
 86             fail[cur] = fail[u] = now;
 87             for (; v && nxt[v][c] == cur; v = fail[v]) nxt[v][c] = now;
 88         }
 89         last = u;
 90         //return len[last] - len[fail[last]];//多添加一个子串所产生不同子串的个数
 91     }
 92 
 93     void get_num() {// 每个节点子串出现的次数
 94         for (int i = 1; i <= tot; i++) X[i] = 0;
 95         for (int i = 1; i <= tot; i++) X[len[i]]++;
 96         for (int i = 1; i <= tot; i++) X[i] += X[i - 1];
 97         for (int i = 1; i <= tot; i++) Y[X[len[i]]--] = i;
 98         for (int i = tot; i >= 1; i--) num[fail[Y[i]]] += num[Y[i]];
 99     }
100 
101     void get_maxx(int n) {// 长度为x的子串出现次数最多的子串的数目
102         get_num();
103         for (int i = 1; i <= tot; i++) maxx[len[i]] = max(maxx[len[i]], num[i]);
104     }
105 
106     void get_sum() {// 该节点后面所形成的自字符串的总数
107         get_num();
108         for (int i = tot; i >= 1; i--) {
109             sum[Y[i]] = 1;
110             for (int j = 0; j <= 25; j++)
111                 sum[Y[i]] += sum[nxt[Y[i]][j]];
112         }
113     }
114 
115     void get_subnum() {//本质不同的子串的个数
116         subnum = 0;
117         for (int i = 1; i <= tot; i++) subnum += len[i] - len[fail[i]];
118     }
119 
120     void get_sublen() {//本质不同的子串的总长度
121         sublen = 0;
122         for (int i = 1; i <= tot; i++) sublen += 1LL * (len[i] + len[fail[i]] + 1) * (len[i] - len[fail[i]]) / 2;
123     }
124 
125     void get_sa() { // Y表示排名为x的节点,X表示该长度前面还有多少个
126         for (int i = 0; i <= tot; i++) X[i] = 0;
127         for (int i = 1; i <= tot; i++) X[len[i]]++;
128         for (int i = 1; i <= tot; i++) X[i] += X[i - 1];
129         for (int i = 1; i <= tot; i++) Y[X[len[i]]--] = i;
130     }
131 
132     void match(char s[]) {//多个串的最长公共子串
133         mem(mx, 0);
134         int n = strlen(s), p = 1, maxlen = 0;
135         for (int i = 0; i < n; i++) {
136             int c = s[i] - 'a';
137             if (nxt[p][c]) p = nxt[p][c], maxlen++;
138             else {
139                 for (; p && !nxt[p][c]; p = fail[p]);
140                 if (!p) p = 1, maxlen = 0;
141                 else maxlen = len[p] + 1, p = nxt[p][c];
142             }
143             mx[p] = max(mx[p], maxlen);
144         }
145         for (int i = tot; i; i--)
146             mx[fail[i]] = max(mx[fail[i]], min(len[fail[i]], mx[i]));
147         for (int i = tot; i; i--)
148             if (minn[i] == -1 || minn[i] > maxx[i]) minn[i] = mx[i];
149     }
150 
151     void get_kth(int k) {//求出字典序第K的子串
152         int pos = 1, cnt;
153         string s = "";
154         while (k) {
155             for (int i = 0; i <= 25; i++) {
156                 if (nxt[pos][i] && k) {
157                     cnt = nxt[pos][i];
158                     if (sum[cnt] < k) k -= sum[cnt];
159                     else {
160                         k--;
161                         pos = cnt;
162                         s += (char) (i + 'a');
163                         break;
164                     }
165                 }
166             }
167         }
168         cout << s << endl;
169     }
170 
171 } sam;
172 
173 int T, cas = 1;
174 char s[maxn];
175 
176 int main() {
177 #ifndef ONLINE_JUDGE
178     FIN;
179 #endif
180     sfi(T);
181     while (T--) {
182         sfs(s);
183         int len = strlen(s);
184         sam.init();
185         printf("Case #%d:\n", cas++);
186         for (int i = 0; i < len;) {
187             int p, maxlen;
188             for (p = 1, maxlen = 0; i < len;) {
189                 int c = s[i] - 'a';
190                 if (!sam.nxt[p][c]) break;
191                 else {
192                     p = sam.nxt[p][c];
193                     sam.extend((s[i] - 'a'));
194                     i++, maxlen++;
195                 }
196             }
197             if (maxlen) printf("%d %d\n", maxlen, sam.L[p] - maxlen);
198             else printf("-1 %d\n", s[i]), sam.extend((s[i] - 'a')), i++;
199         }
200     }
201 
202 #ifndef ONLINE_JUDGE
203     cout << "Totle Time : " << (double) clock() / CLOCKS_PER_SEC << "s" << endl;
204 #endif
205     return 0;
206 }
View Code

 

你可能感兴趣的:(Alice's Classified Message HDU - 5558 后缀自动机求某个后缀出现的最早位置)