【2012百度之星/资格赛】H:用户请求中的品牌 [后缀数组]

时间限制:: 1000ms
内存限制:: 65536kB

描述

馅饼同学是一个在百度工作，做用户请求（query）分析的同学，他在用户请求中经常会遇到一些很奇葩的词汇。在比方说“johnsonjohnson”、“duckduck”，这些词汇虽然看起来是一些词汇的单纯重复，但是往往都是一些特殊品牌的词汇，不能被拆分开。为了侦测出这种词的存在，你今天需要完成我给出的这个任务——“找出用户请求中循环节最多的子串”。

输入

输入数据包括多组，每组为一个全部由小写字母组成的不含空格的用户请求（字符串），占一行。用户请求的长度不大于100,000。
最后一行输入为#，作为结束的标志。

输出

对于每组输入，先输出这个组的编号（第n组就是输出“Case n:”）；然后输出这组用户请求中循环节最多的子串。如果一个用户请求中有两个循环节数相同的子串，请选择那个字典序最小的。

样例输入

ilovejohnsonjohnsonverymuch

duckduckgo

aaabbbcccisagoodcompany

#

样例输出

Case 1: johnsonjohnson

Case 2: duckduck

Case 3: aaa

后缀数组的相关介绍:

后缀数组是处理字符串的有力工具。后缀数组是后缀树的一个非常精巧的替代品，它比后缀树容易编程实现，能够实现后缀树的很多功能而时间复杂度也并不逊色，而且它比后缀树所占用的内存空间小很多。可以说，后缀数组比后缀树要更为实用。自从拜读了罗穗骞大牛的WC2009论文《后缀数组——处理字符串的有力工具》后，经过若干星期的努力（中间有因某些原因而缓下来），终于把论文上面的练习题全部完成了，现在写写自己对后缀数组的理解和感悟。在看本笔记时，请不要忘记了，这是笔记，而教材是《后缀数组——处理字符串的有力工具》。

一：后缀数组的实现

1、定义：Suffix Array数组（SA数组）用于保存从小到大排好序之后的后缀。RANK名次数组用来保存后缀S[i..n]在所有后缀中是第几小的后缀。简单来说，SA数组表示的是“排第几的是谁”，RANK数组表示的是“你的排名是多少”。

2、求SA数组以及RANK数组的方法：详细的请转到罗穗骞大牛的论文，我的学习笔记重点不是要介绍这个。

3、对DA（倍增算法）的一些个人理解：由于我只学习了倍增算法，所以我只能谈谈我对它的理解。DC3算法我没有去研究....

DA算法我是根据罗穗骞的模板写的，根据自己的理解做了些许的小优化。我们现在来看看罗穗骞大牛的模板：

int wa[maxn],wb[maxn],wv[maxn],ws[maxn];
int cmp(int *r,int a,int b,int l)
{return r[a]==r[b]&&r[a+l]==r[b+l];}
void da(int *r,int *sa,int n,int m)
{
int i,j,p,*x=wa,*y=wb,*t;
for(i=0;i<m;i++) ws[i]=0;
for(i=0;i<n;i++) ws[x[i]=r[i]]++;
for(i=1;i<m;i++) ws[i]+=ws[i-1];
for(i=n-1;i>=0;i--) sa[--ws[x[i]]]=i;
for(j=1,p=1;p<n;j*=2,m=p)
{
for(p=0,i=n-j;i<n;i++) y[p++]=i;
for(i=0;i<n;i++) if(sa[i]>=j) y[p++]=sa[i]-j;
for(i=0;i<n;i++) wv[i]=x[y[i]];
for(i=0;i<m;i++) ws[i]=0;
for(i=0;i<n;i++) ws[wv[i]]++;
for(i=1;i<m;i++) ws[i]+=ws[i-1];
for(i=n-1;i>=0;i--) sa[--ws[wv[i]]]=y[i];
for(t=x,x=y,y=t,p=1,x[sa[0]]=0,i=1;i<n;i++)
x[sa[i]]=cmp(y,sa[i-1],sa[i],j)?p-1:p++;
}
return;
}

其实，我个人认为，对于这个算法以及代码，无需过分深入地理解，只需记忆即可，理解只是为了帮助记忆罢了。先解释变量：n为字符串长度，m为字符的取值范围，r为字符串。后面的j为每次排序时子串的长度。

for(i=0;i<m;i++) ws[i]=0;
for(i=0;i<n;i++) ws[x[i]=r[i]]++;
for(i=1;i<m;i++) ws[i]+=ws[i-1];
for(i=n-1;i>=0;i--) sa[--ws[x[i]]]=i;

这四行代码，进行的是对R中长度为1的子串进行基数排序。x数组在后面需要用到，所以先复制r数组的值。特别需要注意的是，第四行的for语句，初始化语句为i=n-1，如果写得不太熟练，很容易习惯性地写成i=0，我一开始就是。理解这是基数排序的最好方法，找个例子，自己推推....

for(p=0,i=n-j;i<n;i++) y[p++]=i;
for(i=0;i<n;i++) if(sa[i]>=j) y[p++]=sa[i]-j;

这两行代码，利用了上一次基数排序的结果，对待排序的子串的第二关键字进行了一次高效地基数排序。我们可以结合下面的图来理解：

【2012百度之星/资格赛】H:用户请求中的品牌 [后缀数组]

不难发现，除了第一次基数排序以外，之后的每次双关键字排序，设此次排序子串长度为j，则从第n-j位开始的子串，其第二关键字均为0，所以得到第一个for语句：for(p=0,i=n-j;i<n;i++) y[p++]=i;使用pascal的朋友们注意了，这里之所以是n-j位，是因为c++的字符串是从第0位开始表示的。这里，p暂时成为了一个计数变量。第二个语句的意义，分析上图也不难理解，这里留给朋友们你们自行思考啦。（不如说我懒...）

for(i=0;i<n;i++) wv[i]=x[y[i]];
for(i=0;i<m;i++) ws[i]=0;
for(i=0;i<n;i++) ws[wv[i]]++;
for(i=1;i<m;i++) ws[i]+=ws[i-1];
for(i=n-1;i>=0;i--) sa[--ws[wv[i]]]=y[i];

与一开始的4个for语句意义相同，基数排序。至于为什么wv[i]=x[y[i]]，这个我想了蛮久没想通...硬记算了- -哪位朋友理解的希望能告诉我一声...

for(t=x,x=y,y=t,p=1,x[sa[0]]=0,i=1;i<n;i++)
x[sa[i]]=cmp(y,sa[i-1],sa[i],j)?p-1:p++;

这个for语句中的初始化语句里，完成了x数组和y数组的交换，用了指针的交换节约时间，简化代码。这里需要注意的是p和i的初始值都是1，不是0.其实如果记得后面的语句，不难看出它们的初始值不能为0，因为后面有i-1和p-1嘛。这个for语句的意义要结合cmp函数来理解。反正，你知道这里p的值表示的是此时关键字不同的串的数量就对了。当p=n的时候，说明所有串都已经排好序了（它们的排名都唯一确定）。所以，一开始的循环语句中，循环条件是（p<n）。

另外，在使用倍增算法前，需要保证r数组的值均大于0。然后要在原字符串后添加一个0号字符，具体原因参见罗穗骞的论文。这时候，若原串的长度为n，则实际要进行后缀数组构建的r数组的长度应该为n+1.所以调用da函数时，对应的n应为n+1.

二、后缀数组的应用--height数组

在介绍后缀数组的应用前，先介绍后缀数组的一个重要附属数组：height数组。

1、height 数组：定义height[i]=suffix(sa[i-1])和suffix(sa[i])的最长公
共前缀，也就是排名相邻的两个后缀的最长公共前缀。

height数组是应用后缀数组解题是的核心，基本上使用后缀数组解决的题目都是依赖height数组完成的。

2、height数组的求法：具体的求法参见罗穗骞的论文。对于height数组的求法，我并没有去深刻理解，单纯地记忆了而已...有兴趣的朋友可以去钻研钻研再和我交流交流

这里给出代码：

int rank[maxn],height[maxn];
void calheight(int *r,int *sa,int n)
{
int i,j,k=0;
for(i=1;i<=n;i++) rank[sa[i]]=i;
for(i=0;i<n;height[rank[i++]]=k)
for(k?k--:0,j=sa[rank[i]-1];r[i+k]==r[j+k];k++);
return;
}

3、一些注意事项：height数组的值应该是从height[1]开始的，而且height[1]应该是等于0的。原因是，因为我们在字符串后面添加了一个0号字符，所以它必然是最小的一个后缀。而字符串中的其他字符都应该是大于0的（前面有提到，使用倍增算法前需要确保这点），所以排名第二的字符串和0号字符的公共前缀（即height[1]）应当为0.在调用calheight函数时，要注意height数组的范围应该是[1..n]。所以调用时应该是calheight(r,sa,n)而不是calheight(r,sa,n+1)。要理解清楚这里的n的含义是什么。

calheight过程中，对rank数组求值的for语句的初始语句是i=1而不是i=0的原因，和上面说的类似，因为sa[0]总是等于那个已经失去作用的0号字符，所以没必要求出其rank值。当然你错写成for (i=0..)，也不会有什么问题。

三、后缀数组解题总结：

1、求单个子串的不重复子串个数。SPOJ 694、SPOJ 705.

这个问题是一个特殊求值问题。要认识到这样一个事实：一个字符串中的所有子串都必然是它的后缀的前缀。（这句话稍微有点绕...）对于每一个sa[i]后缀，它的起始位置sa[i]，那么它最多能得到该后缀长度个子串（n-sa[i]个），而其中有height[i]个是与前一个后缀相同的，所以它能产生的实际后缀个数便是n-sa[i]-height[i]。遍历一次所有的后缀，将它产生的后缀数加起来便是答案。

代码及题解：http://hi.baidu.com/fhnstephen/blog/item/68f919f849748668024f56fb.html

2、后缀的最长公共前缀。（记为lcp（x，y））

这是height数组的最基本性质之一。具体的可以参看罗穗骞的论文。后缀i和后缀j的最长公共前缀的长度为它们在sa数组中所在排位之间的height值中的最小值。这个描述可能有点乱，正规的说，令x=rank[i],y=rank[j]，x<y,那么lcp(i,j)=min(height[x+1],height[x+2]...height[y])。lcp(i,i)=n-sa[i]。解决这个问题，用RMQ的ST算法即可（我只会这个，或者用最近公共祖先那个转化的做法）。

3、最长重复子串（可重叠）

要看到，任何一个重复子串，都必然是某两个后缀的最长公共前缀。因为，两个后缀的公共前缀，它出现在这两个后缀中，并且起始位置时不同的，所以这个公共前缀必然重复出现两次以上（可重叠）。而任何两个后缀的最长公共前缀为某一段height值中的最小值，所以最大为height值中的最大值（即某个lcp(sa[i],sa[i+1]））。所以只要算出height数组，然后输出最大值就可以了。

一道题目和代码：http://hi.baidu.com/fhnstephen/blog/item/4ed09dffdec0a78eb801a0ba.html

4、最长重复不重叠子串 PKU1743

这个问题和3的唯一区别在于能否重叠。加上不能重叠这个限制后，直接求解比较困难，所以我们选择二分枚举答案，将问题转换为判定性问题。假设当时枚举的长度为k，那么要怎样判断是否存在长度为k的重复不重叠子串呢？

首先，根据height数组，将后缀分成若干组，使得每组后缀中，后缀之间的height值不小于k。这样分组之后，不难看出，如果某组后缀数量大于1，那么它们之中存在一个公共前缀，其长度为它们之间的height值的最小值。而我们分组之后，每组后缀之间height值的最小值大于等于k。所以，后缀数大于1的分组中，有可能存在满足题目限制条件的长度不小于k的子串。只要判断满足题目限制条件成立，那么说明存在长度至少为k的合法子串。

对于本题，限制条件是不重叠，判断的方法是，一组后缀中，起始位置最大的后缀的起始位置减去起始位置最小的后缀的起始位置>=k。满足这个条件的话，那么这两个后缀的公共前缀不但出现两次，而且出现两次的起始位置间隔大于等于k，所以不会重叠。

深刻理解这种height分组方法以及判断重叠与否的方法，在后面的问题中起到举足轻重的作用。

练习及题解：http://hi.baidu.com/fhnstephen/blog/item/85a25b208263794293580759.html

5、最长的出现k次的重复（可重叠）子串。 PKU3261

使用后缀数组解题时，遇到“最长”，除了特殊情况外（如问题3），一般需要二分答案，利用height值进行分组。本题的限制条件为出现k次。只需判断，有没有哪一组后缀数量不少于k就可以了。相信有了我前面问题的分析作为基础，这个应该不难理解。注意理解“不少于k次”而不是“等于k次”的原因。如果理解不了，可以找个具体的例子来分析分析。

题目及题解：http://hi.baidu.com/fhnstephen/blog/item/be7d15133ccbe7f0c2ce79bb.html

6、最长回文子串 ural1297

这个问题没有很直接的方法可以解决，但可以采用枚举的方法。具体的就是枚举回文子串的中心所在位置i。注意要分回文子串的长度为奇数还是偶数两种情况分析。然后，我们要做的，是要求出以i为中心的回文子串最长为多长。利用后缀数组，可以设计出这样一种求法：求i往后的后缀与i往前的前缀的最长公共前缀。我这里的表述有些问题，不过不影响理解。

要快速地求这个最长前缀，可以将原串反写之后接在原串后面。在使用后缀数组的题目中，连接两个（n个）字符串时，中间要用不可能会出现在原串中，不一样的非0号的字符将它们隔开。这样可以做到不影响后缀数组的性质。然后，问题就可以转化为求两个后缀的最长公共前缀了。具体的细节，留给大家自己思考...（懒...原谅我吧，都打这么多字了..一个多小时了啊TOT）

题目及题解：http://hi.baidu.com/fhnstephen/blog/item/68342f1d5f9e3cf81ad576ef.html

7、求一个串最多由哪个串复制若干次得到 PKU2406

具体的问题描述请参考PKU2406.这个问题可以用KMP解决，而且效率比后缀数组好。

利用后缀数组直接解决本题也很困难（主要是，就算二分答案，也难以解决转变而成的判定性问题。上题也是），但可以同过枚举模板串的长度k（模板串指被复制的那个串）将问题变成一个后缀数组可以解决的判定性问题。首先判断k能否被n整除，然后只要看lcp(1,k+1)（实际在用c写程序时是lcp(0,k)）是否为n-k就可以了。

为什么这样就行了呢？这要充分考虑到后缀的性质。当lcp（1，k+1）=n-k时，后缀k+1是后缀1（即整个字符串）的一个前缀。（因为后缀k+1的长度为n-k）那么，后缀1的前k个字符必然和后缀k+1的前k个字符对应相同。而后缀1的第k+1..2k个字符，又相当于后缀k+1的前k个字符，所以与后缀1的前k个字符对应相同，且和后缀k的k+1..2k又对应相同。依次类推，只要lcp(1,k+1)=n-k,那么s[1..k]就可以通过自复制n/k次得到整个字符串。找出k的最小值，就可以得到n/k的最大值了。

题目及题解：http://hi.baidu.com/fhnstephen/blog/item/5d79f2efe1c3623127979124.html

8、求两个字符串的最长公共子串。Pku2774、Ural1517

首先区分好“最长公共子串”和“最长公共子序列”。前者的子串是连续的，后者是可以不连续的。

对于两个字符串的问题，一般情况下均将它们连起来，构造height数组。然后，最长公共子串问题等价于后缀的最长公共前缀问题。只不过，并非所有的lcp值都能作为问题的答案。只有当两个后缀分属两个字符串时，它们的lcp值才能作为答案。与问题3一样，本题的答案必然是某个height值，因为lcp值是某段height值中的最小值。当区间长度为1时，lcp值等于某个height值。所以，本题只要扫描一遍后缀，找出后缀分属两个字符串的height值中的最大值就可以了。判断方法这里就不说明了，留给大家自己思考...

题目及题解：

http://hi.baidu.com/fhnstephen/blog/item/8666a400cd949d7b3812bb44.html

http://hi.baidu.com/fhnstephen/blog/item/b5c7585600cadfc8b645aebe.html

9、重复次数最多的重复子串 SPOJ 687，Pku3693

难度比较大的一个问题，主要是罗穗骞的论文里的题解写得有点含糊不清。题目的具体含义可以去参考Pku3693.

又是一题难以通过二分枚举答案解决的问题（因为要求的是重复次数），所以选择朴素枚举的方法。先枚举重复子串的长度k，再利用后缀数组来求长度为k的子串最多重复出现多少次。注意到一点，假如一个字符串它重复出现2次（这里不讨论一次的情况，因为那是必然的），那么它必然包含s[0],s[k],s[2*k]...之中的相邻的两个。所以，我们可以枚举一个数i，然后判断从i*k这个位置起的长度为k的字符串能重复出现多少次。判断方法和8中的相似，lcp(i*k,(i+1)*k)/k+1。但是，仅仅这样会忽略点一些特殊情况，即重复子串的起点不在[i*k]位置上时的情况。这种情况应该怎么求解呢？看下面这个例子：

aabababc

当k=2，i=1时，枚举到2的位置，此时的重复子串为ba(注意第一位是0),lcp(2，4)=3，所以ba重复出现了2次。但实际上，起始位置为1的字符串ab出现次数更多，为3次。我们注意到，这种情况下，lcp(2,4)=3，3不是2的整数倍。说明当前重复子串在最后没有多重复出现一次，而重复出现了部分（这里是多重复出现了一个b）。如果我这样说你没有看懂，那么更具体地：

sa[2]=bababc

sa[4]=babc

lcp=bab

现在注意到了吧，ba重复出现了两次之后，出现了一个b，而a没有出现。那么，不难想到，可以将枚举的位置往前挪一位，这样这个最后的b就能和前面的一个a构成一个重复子串了，而假如前挪的一位正好是a，那么答案可以多1。所以，我们需要求出a=lcp(i*k,(i+1)*k)%n，然后向前挪k-a位，再用同样的方法求其重复出现的长度。这里，令b=k-a,只需要lcp(b,b+k)>=k就可以了。实际上，lcp(b,b+k)>=k时，lcp(b,b+k)必然大于等于之前求得的lcp值，而此时答案的长度只加1。没有理解的朋友细细体会下上图吧。

题目及题解：http://hi.baidu.com/fhnstephen/blog/item/870da9ee3651404379f0555f.html

10.多个串的公共子串问题 PKU3294

首先将串连接起来，然后构造height数组，然后怎么办呢？

对，二分答案再判断是否可行就行了。可行条件很直观：有一组后缀，有超过题目要求的个数个不同的字符串中的后缀存在。即，假如题目要求要出现在至少k个串中，那么就得有一组后缀，在不同字符串中的后缀数大于等于k。

题目及题解：http://hi.baidu.com/fhnstephen/blog/item/49c3b7dec79ec5e377c638f1.html

11、出现或反转后出现所有字符串中的最长子串 PKU1226

http://hi.baidu.com/fhnstephen/blog/item/7fead5020a16d2da267fb5c0.html

12、不重叠地至少两次出现在所有字符串中的最长子串 spoj220 http://hi.baidu.com/fhnstephen/blog/item/1dffe1dda1c98754cdbf1a35.html

之所以把两题一起说，因为它们大同小异，方法在前面的题目均出现过。对于多个串，连起来；反转后出现，将每个字符串反写后和原串都连起来，将反写后的串和原串看成同一个串；求最长，二分答案后height分组；出现在所有字符串中（反写后的也行），判断方法和10一样，k=n而已；不重叠见问题4，只不过这里对于每个字符串都要进行检验而已。

13、两个字符串的重复子串个数。 Pku3415

我个人觉得颇有难度的一个问题。具体的题目描述参看Pku3415。

大家可以移步到这：http://hi.baidu.com/fhnstephen/blog/item/bf06d001de30fc034afb51c1.html

14、最后的总结

用后缀数组解题有着一定的规律可循，这是后缀的性质所决定的，具体归纳如下：

1、N个字符串的问题（N>1）

方法：将它们连接起来，中间用不会出现在原串中的，互不相同的，非0号字符分隔开。

2、无限制条件下的最长公共子串（重复子串算是后缀们的最长公共前缀）

方法：height的最大值。这里的无限制条件是对子串无限制条件。最多只能是两个串的最长公共子串，才可以直接是height的最大值。

3、特殊条件下的最长子串

方法：二分答案，再根据height数组进行分组，根据条件完成判定性问题。三个或以上的字符串的公共子串问题也需要二分答案。设此时要验证的串长度为len，特殊条件有：

3.1、出现在k个串中

条件：属于不同字符串的后缀个数不小于k。（在一组后缀中，下面省略）

3.2、不重叠

条件：出现在同一字符串中的后缀中，出现位置的最大值减最小值大于等于len。

3.3、可重叠出现k次

条件：出现在同一字符串中的后缀个数大于等于k。若对于每个字符串都需要满足，需要逐个字符串进行判断。

4、特殊计数

方法：根据后缀的性质，和题目的要求，通过自己的思考，看看用后缀数组能否实现。一般和“子串”有关的题目，用后缀数组应该是可以解决的。

5、重复问题

知道一点：lcp(i,i+k)可以判断，以i为起点，长度为k的一个字符串，它向后自复制的长度为多少，再根据具体题目具体分析，得出算法即可。

算法面试题深度解析：LeetCode 2012.数组元素的美丽值求和计算与多方案对比数据大包哥数据结构和算法 java
算法面试题深度解析：LeetCode2012.数组元素的美丽值求和计算与多方案对比原题给你一个下标从0开始的整数数组nums。对于每个下标i（1nums[i]；1分：不满足2分条件，但满足nums[i-1]
sa后缀数组使用合集，包括height数组求LPC和LCS，ST表，单调队列优化。 Lqingyyyy c++sa后缀数组思维
P5546[POI2000]公共串所有串合在一起，每两个串放不同的字符，求一遍后缀数组，然后利用height数组求LCS即可。#include#include#include#includeusingnamespacestd;constintN=1e5+10;//sa是排名i的编号，rk是i排名几intsa[N],rk[N],height[N],cnt[N],oldrk[N],id[N];stri
算法分类合集 weixin_30784945
算法分类合集ACM所有算法数据结构栈，队列，链表哈希表，哈希数组堆，优先队列双端队列可并堆左偏堆二叉查找树Treap伸展树并查集集合计数问题二分图的识别平衡二叉树二叉排序树线段树一维线段树二维线段树树状数组一维树状数组N维树状数组字典树后缀数组，后缀树块状链表哈夫曼树桶，跳跃表Trie树(静态建树、动态建树)AC自动机LCA和RMQ问题KMP算法图论基本图算法图广度优先遍历深度优先遍历拓扑排序割边
ACM算法分类（要学习的东西还很多）还是太年轻
ACM所有算法数据结构栈，队列，链表哈希表，哈希数组堆，优先队列双端队列可并堆左偏堆二叉查找树Treap伸展树并查集集合计数问题二分图的识别平衡二叉树二叉排序树线段树一维线段树二维线段树树状数组一维树状数组N维树状数组字典树后缀数组，后缀树块状链表哈夫曼树桶，跳跃表Trie树(静态建树、动态建树)AC自动机LCA和RMQ问题KMP算法图论基本图算法图广度优先遍历深度优先遍历拓扑排序割边割点强连通分
ACM算法目录龍木
ACM所有算法数据结构栈，队列，链表哈希表，哈希数组堆，优先队列双端队列可并堆左偏堆二叉查找树Treap伸展树并查集集合计数问题二分图的识别平衡二叉树二叉排序树线段树一维线段树二维线段树树状数组一维树状数组N维树状数组字典树后缀数组，后缀树块状链表哈夫曼树桶，跳跃表Trie树(静态建树、动态建树)AC自动机LCA和RMQ问题KMP算法图论基本图算法图广度优先遍历深度优先遍历拓扑排序割边割点强连通分
2024.1.31力扣每日一题——找出不同元素数目差数组菜菜的小彭力扣每日一题 java leetcode 算法 java
2024.1.31题目来源我的题解方法一哈希表+前后缀题目来源力扣每日一题；题序：2670我的题解方法一哈希表+前后缀从左到右计算前缀数组pre[i]表示nums[0,i]的不同元素个数；从右到左计算后缀suff[i]表示nums(i,nums.length]的不同元素个数；结果数组：pre[i]-suff[i]。由于后续的后缀数组和结果数组可以复用前面的前缀数组，所以只需要定义一个数组时间复杂度
91 . B. Queue (灵茶每日一题 : 01-23) ros275229 算法学习灵茶 CF c++灵茶 codeforces
链接:Problem-B-Codeforces思路:预处理后缀数组，存后面最小的值；然后二分；代码:#include#defineIOSios::sync_with_stdio(0);cin.tie(0);cout.tie(0);#defineendl'\n'#definelowbit(x)(x&(-x))#definesz(a)(int)a.size()#definepbpush_back#de
超级简单的后缀数组（SA）！！一棵油菜花算法篇笔记 c++算法
更好的食用体验超级简单的后缀数组（SA）！！前言这里选择当一手标题党。由于刚学完这个字符串算法，本人字符串算法又比较薄弱，好不容易这一次在晚修看各种资料看得七七八八，决定趁脑子清醒的时候记录下来。免得自己不久后忘了后又要痛苦地再看各种资料。希望这篇博客能帮到你。前置知识：RMQ问题、基数排序、lcp问题使用指南：在抽象的时候，可以选择先不看证明；先记住结论，顺一遍后再返回来补证明也是可以的。如果有
蓝桥杯每日一题---基数排序花落yu 蓝桥杯职场和发展
题目分析在实际的比赛过程中很少会自己手写排序，顶多是定义一下排序规则。之所以要练习一下基数排序，是因为在后续学习过程中学到后缀数组时需要自己手写基数排序，那么这里使用的方法也和后缀数组一致，理解这里也便于后缀数组的学习。桶排序全流程回顾原数组：123426123147根据第一关键字即个位数放桶2号桶：123号桶：1234号桶：34146号桶：267号桶：7根据关键字实现一轮排序1212334142
[acm算法学习] 后缀数组SA Waldeinsamkeit41 学习
学习自B站up主kouylan定义后缀是包含最后个字母的子串把字符串str的所有后缀按字典排序，sa[i]表示排名为i的后缀的开头下标如何求解SA倍增的方法先把每个位置开始的长度为1的子串排序，在此基础上再把长度为2的子串排序（长度为2的子串就是前面算过的长度为1的子串再加上后面的一位，第i位的和i+1），再把长度为4，8，16，32...（两个两个拼）直到串的末尾，也就是排到了后缀。如何从2^(
【LeetCode:2866. 美丽塔 II | 单调栈 + 前后缀数组】硕风和炜 LeetCode每日一题打卡 leetcode 算法 java 单调栈前缀后缀数组数据结构
算法题算法刷题专栏|面试必备算法|面试高频算法越难的东西,越要努力坚持，因为它具有很高的价值，算法就是这样✨作者简介：硕风和炜，CSDN-Java领域新星创作者，保研|国家奖学金|高中学习JAVA|大学完善JAVA开发技术栈|面试刷题|面经八股文|经验分享|好用的网站工具分享恭喜你发现一枚宝藏博主,赶快收入囊中吧人生如棋，我愿为卒，行动虽慢，可谁曾见我后退一步？算法题目录题目链接⛲题目描述求解思路
牛客练习赛87题解 successzjl23 牛客
A思维题当k=n−1k=n-1k=n−1的时候特判一下就行了回超intintint开longlonglonglonglonglongB思维题找一个数组存一下x左右两边比x小的数有多少个前缀后缀数组的那种forforfor循环lll二分rrrCdfsdfsdfs贪心#includeusingnamespacestd;typedeflonglongll;unordered_mapf;llt,n;llq
后缀数组模板之高度数组花落yu java 算法 jvm
高度数组1.理解相关数组的含义rk[i]：表示原始下标为i的后缀字符串排序后对应的下标（也就是原始下标为i的后缀字符串排序后为第rk[i]小）height[i]：表示排名为i和i-1的后缀字符串的最长公共前缀的长度，注意这里的i是排名，不是原始下标2.定理证明定理：height[rk[i]]>=height[rk[i-1]]-1采用先抽象后具体的方式进行详细的证明。抽象证明假设原始下标i-1对应的
后缀数组模板花落yu java 算法数据结构
详细理解后缀数组求sa数组的函数，该函数可以看为主要分为三个部分，第一个部分是预处理；第二个部分是进行基数排序，首先根据第二关键词排序，然后根据第一关键字排序；第三个部分是根据排序后的结果重新为每个字符串分配桶。后两个部分以倍增的形式重复，直到排序结束。理解各个数组的含义x[i]：记录原始下标为i的字符串所在桶的编号c[i]：记录编号为i的桶，在所有桶中的累计价值，也就是前缀和，在求前缀和之前，要
【每日一题】从二叉搜索树到更大和树 wang_nn LeetCode每日一题中序遍历二叉搜索树BST 2023-12-04 C++
文章目录Tag题目来源题目解读解题思路方法一：中序遍历的反序方法二：后缀数组写在最后Tag【中序遍历】【二叉树】【2023-12-04】题目来源1038.从二叉搜索树到更大和树题目解读在二叉搜索树中，将每一个节点的值替换成树中大于等于该节点值的所有节点值之和。解题思路方法一：中序遍历的反序前言给的是一棵二叉搜索树（英文名称为BinarySearchTree，以下简称为BST），我们要充分利用BST
【读书笔记】《算法竞赛进阶指南》读书笔记——0x10基本数据结构 RM -RF /星算法竞赛进阶指南 C++ACM ICPC 算法读书笔记
todo(perhapsnever)CH1401后缀数组所有课后题栈例题：HDU4699Editor维护一个整数序列的编辑器，支持以下五种操作：Ix：在当前光标位置处插入一个整数x，插入后光标移动到x之后D：删除光标之前的一个元素，相当于按下退格键L：光标左移一个位置，相当于按下左方向键R：光标右移一个位置，相当于按下右方向键Qk：在位置k之前最大的前缀和，k不超过光标当前的位置建立两个栈，栈A储
后缀数组SA Qres821 字符串后缀数组 sa
https://uoj.ac/problem/35通过倍增实现排序类似基数排序，先排后面，再排前面排的过程可以拿桶排优化设h(i)=lcp(sa[rk[i]−1],i)h(i)=lcp(sa[rk[i]-1],i)h(i)=lcp(sa[rk[i]−1],i)有h(i)≥h(i−1)−1h(i)\geh(i-1)-1h(i)≥h(i−1)−1#includeusingnamespacestd;//
信息学奥赛提高组--专题讲解（视频） wzcwzc2023 c++算法
1.动态规划专题（基础篇与提高篇）提取码:TYWZ2.数学专题提取码:TYWZ3.树上算法专题提取码:TYWZ4.图论专题提取码:NOIP5.二分、倍增与树状数组专题提取码:NOIP6.字符串：后缀数组、自动机提取码:CTSC7.字符串:SAM提取码:APIO8.字符串：回文自动机提取码:CSPS9.数据结构提取码:WCET10.字符串（基础篇)提取码:NOTT11.矩阵与概率提取码:FTTT12
Hash(哈希（字符串哈希）)模板和做题总结（详细易懂）？！？？哈希算法算法 c++数据结构散列表
文章目录目录文章目录前言：一Hash表1Hash函数的构造2拉链法处理hash冲突模板3开放寻址法处理hash冲突4（例题）、雪花雪花二字符串HashO(n)+O(m)1.回文子串的最大长度2后缀数组3矩阵4树形地铁系统（涉及树的知识）三C++ST库之unordered_map——哈希表前言：在学习本节课之前，请大家思考这样一个问题：如果我们要在一个长度为的随机整数序列中统计每个数出现的次数，可以
SCAU2021春季个人排位赛第四场（部分题解）晁棠题解
预设应该有：简单题：AD中等题：BCF较难题：EGA：二分B：状压DPC：最短路+二分D：单调栈E：后缀数组/后缀自动机F：贪心+堆G：2-SAT状压不会，最短路有些许忘记，先写了其中已经改了的题解先。A题CodeForces-371CPolycarpusloveshamburgersverymuch.Heespeciallyadoresthehamburgershemakeswithhisown
2021.3.21校排位赛（待续吃花椒的妙酱
文章目录序ACodeForces371CHamburgersB方格取数CTelephoneLines架设电话线dboj-1614DFeelGoodPOJ-2796FStallReservationsPOJ-3190总结序简单题：AD中等题：BCF较难题：EGA：二分B：状压DPC：最短路+二分D：单调栈E：后缀数组/后缀自动机F：贪心+堆G：2-SATACodeForces371CHamburge
后缀数组- 卷心菜不卷Iris 算法进阶后缀数组
后缀数组代码/*n:代表字符串长度m:代表字符集大小s数组：字符串数组,内容从下标1开始rk数组:排名数组c数组：基数排序的数组，下标为待排序的数字，值为该数字出现的次数。排序过程中，我们会对其求前缀和以便计算排名x数组：是一个中间量数组，意义为得到第一关键字的大小，对于一次排序，下标为代表后缀编号，值为象征对应后缀编号第一关键字大小的值（事实上可以视作排名）y数组：是一个中间量数组，意义为第二关
【字符串】后缀数组 F_yx 字符串算法
参考文章：数据结构——字符串：后缀数组_Jetiaime的博客-CSDN博客（算法代码）后缀数组_KonjakLAF的博客-CSDN博客（应用+例题）板子：#includeusingnamespacestd;typedeflonglongll;constintN=1e7+5;constintinf=1k)id[++idx]=sa[i]-k;//按后一半排序的后缀memset(cnt,0,sizeo
PHP实现阿里云OSS文件上传她已不在 接口 php
PHP实现oss签名生成及简单文件上传获取访问域名classOssFileClass{constAccessKeyId='你自己的AccessKey';constAccessKeySecret='你自己的AccessKeySecret';constBucketName="你的存储空间名称";/****生成签名并调用上传接口*@paramarray$upload_name上传的文件名称及后缀数组*@
国庆第二天训练总结胖亚亚日常训练日记
今天打得应该是合肥的比赛emmmmm题目难度，，，，偏难一点而且题目时长都给的很多，120秒的都有，正解是后缀数组维护，不过暴力给过了还有道规律题在纸上画了六页。。。。不过最后a掉了，开心还有一个图论的题目，没做出来，这套比赛打的没什么感觉，没有配合感觉，有点难受
SuffixArray练习题 miss you ya 软件测试 java 算法开发语言
SuffixArray练习题题目importjava.util.Arrays;classSuffixArray{//LCP:Longestcommonprefix/*字符串后缀，指从字符串某个*位置开始到字符串末尾的字串，原串和空串也是后缀*CreatetheLCParrayfromthesuffixarray*从后缀数组创建LCP数组*@paramstheinputarraypopulatedf
七.前后缀分解价值成长 leetcode 算法数据结构
238.除自身以外数组的乘积classSolution:defproductExceptSelf(self,nums:List[int])->List[int]:n=len(nums)p=[1]*n;s=1foriinrange(1,n):p[i]=p[i-1]*nums[i-1]foriinrange(n-1,-1,-1):p[i]*=ss*=nums[i]returnp#前后缀数组#p前缀数组
算法：字符串和二分搜索相关题目 sjz_hahalala479 算法 leetcode 面试
字符串面试的概念回文子串（连续）、子序列（不连续）前缀树（Trie树）、后缀树和后缀数组匹配字典序字符串题目类型规则判断判断字符串是否符合整数、浮点数是否返回回文规则数字运算大整数相关的加、减、乘、除操作与数组操作有关排序技巧、快排划分技巧字符计数类型hash表、依据ascii范围使用固定长度数组进行统计255、65535计数题常见类型：滑动窗口、寻找无重复子串、变位词动态规划最长公共子串、最长公
后缀数组 szh_0808 字符串
后缀数组简介什么是后缀数组后缀数组SA[]SA[]SA[]保存的是1∼n1\simn1∼n的一个排列，其每个位置的元素代表将整个字符串的nnn个后缀排序后第iii小的后缀的首字母的下标。如何求后缀数组在求之前，先记住几个变量所代表的含义：sa[i]sa[i]sa[i]：后缀数组，代表第iii小的后缀的首字母下标。rk[i]rk[i]rk[i]：名次数组，代表首字母下标为iii的后缀的名次。上面两个
算法习题之DC3生成后缀数组 mua码算法 java 数据结构
DC3介绍用DC3算法生成后缀数组的流程DC3模板习题1给你一个字符串s，找出它的所有子串并按字典序排列，返回排在最后的那个子串介绍用DC3算法生成后缀数组的流程1.得到S12的精确排名（取S12的前三位进行桶排序）2.s1按照原来在数组的顺序放在左边（放第一步的排名），s2按照原来在数组的顺序放在右边中间（放第一步的排名）用最小的ASCII隔开（如果第一步得到精确的排名，跳过第2步）3.得到s0
scala的option和some 矮蛋蛋编程 scala
原文地址： http://blog.sina.com.cn/s/blog_68af3f090100qkt8.html 对于学习 Scala 的 Java™ 开发人员来说，对象是一个比较自然、简单的入口点。在本系列前几期文章中，我介绍了 Scala 中一些面向对象的编程方法，这些方法实际上与 Java 编程的区别不是很大。我还向您展示了 Scala 如何重新应用传统的面向对象概念，找到其缺点
NullPointerException Cb123456 android BaseAdapter
java.lang.NullPointerException: Attempt to invoke virtual method 'int android.view.View.getImportantForAccessibility()' on a null object reference 出现以上异常.然后就在baidu上
PHP使用文件和目录天子之骄 php文件和目录读取和写入 php验证文件 php锁定文件
PHP使用文件和目录 1.使用include()包含文件 (1)：使用include()从一个被包含文档返回一个值 (2)：在控制结构中使用include() include_once()函数需要一个包含文件的路径，此外，第一次调用它的情况和include()一样，如果在脚本执行中再次对同一个文件调用，那么这个文件不会再次包含。在php.ini文件中设置
SQL SELECT DISTINCT 语句何必如此 sql
SELECT DISTINCT 语句用于返回唯一不同的值。 SQL SELECT DISTINCT 语句在表中，一个列可能会包含多个重复值，有时您也许希望仅仅列出不同（distinct）的值。 DISTINCT 关键词用于返回唯一不同的值。 SQL SELECT DISTINCT 语法 SELECT DISTINCT column_name,column_name F
java冒泡排序 3213213333332132 java 冒泡排序
package com.algorithm; /** * @Description 冒泡 * @author FuJianyong * 2015-1-22上午09:58:39 */ public class MaoPao { public static void main(String[] args) { int[] mao = {17,50,26,18,9,10
struts2.18 +json,struts2-json-plugin-2.1.8.1.jar配置及问题！ 7454103 DAO spring Ajax json qq
struts2.18 出来有段时间了！（貌似是稳定版）闲时研究下下！貌似 sruts2 搭配 json 做 ajax 很吃香！实践了下下！不当之处请绕过！呵呵网上一大堆 struts2+json 不过大多的json 插件都是 jsonplugin.34.jar strut
struts2 数据标签说明 darkranger jsp bean struts servlet Scheme
数据标签主要用于提供各种数据访问相关的功能，包括显示一个Action里的属性，以及生成国际化输出等功能数据标签主要包括： action ：该标签用于在JSP页面中直接调用一个Action，通过指定executeResult参数，还可将该Action的处理结果包含到本页面来。 bean ：该标签用于创建一个javabean实例。如果指定了id属性，则可以将创建的javabean实例放入Sta
链表.简单的链表节点构建 aijuans 编程技巧
/*编程环境WIN-TC*/ #include "stdio.h" #include "conio.h" #define NODE(name, key_word, help) \ Node name[1]={{NULL, NULL, NULL, key_word, help}} typedef struct node { &nbs
tomcat下jndi的三种配置方式 avords tomcat
jndi(Java Naming and Directory Interface，Java命名和目录接口)是一组在Java应用中访问命名和目录服务的API。命名服务将名称和对象联系起来，使得我们可以用名称访问对象。目录服务是一种命名服务，在这种服务里，对象不但有名称，还有属性。 tomcat配置
关于敏捷的一些想法 houxinyou 敏捷
从网上看到这样一句话：“敏捷开发的最重要目标就是：满足用户多变的需求，说白了就是最大程度的让客户满意。” 感觉表达的不太清楚。感觉容易被人误解的地方主要在“用户多变的需求”上。第一种多变，实际上就是没有从根本上了解了用户的需求。用户的需求实际是稳定的，只是比较多，也比较混乱，用户一般只能了解自己的那一小部分，所以没有用户能清楚的表达出整体需求。而由于各种条件的，用户表达自己那一部分时也有
富养还是穷养，决定孩子的一生 bijian1013 教育人生
是什么决定孩子未来物质能否丰盛？为什么说寒门很难出贵子，三代才能出贵族？真的是父母必须有钱，才能大概率保证孩子未来富有吗？-----作者：@李雪爱与自由事实并非由物质决定，而是由心灵决定。一朋友富有而且修养气质很好，兄弟姐妹也都如此。她的童年时代，物质上大家都很贫乏，但妈妈总是保持生活中的美感，时不时给孩子们带回一些美好小玩意，从来不对孩子传递生活艰辛、金钱来之不易、要懂得珍惜
oracle 日期时间格式转化征客丶 oracle
oracle 系统时间有 SYSDATE 与 SYSTIMESTAMP； SYSDATE：不支持毫秒，取的是系统时间； SYSTIMESTAMP：支持毫秒，日期，时间是给时区转换的，秒和毫秒是取的系统的。日期转字符窜：一、不取毫秒： TO_CHAR(SYSDATE, 'YYYY-MM-DD HH24:MI:SS') 简要说明， YYYY 年 MM 月
【Scala六】分析Spark源代码总结的Scala语法四 bit1129 scala
1. apply语法 FileShuffleBlockManager中定义的类ShuffleFileGroup，定义： private class ShuffleFileGroup(val shuffleId: Int, val fileId: Int, val files: Array[File]) { ... def apply(bucketId
Erlang中有意思的bug bookjovi erlang
代码中常有一些很搞笑的bug，如下面的一行代码被调用两次（Erlang beam） commit f667e4a47b07b07ed035073b94d699ff5fe0ba9b Author: Jovi Zhang <bookjovi@gmail.com> Date: Fri Dec 2 16:19:22 2011 +0100 erts:
移位打印10进制数转16进制-2008-08-18 ljy325 java 基础
/** * Description 移位打印10进制的16进制形式 * Creation Date 15-08-2008 9:00 * @author 卢俊宇 * @version 1.0 * */ public class PrintHex { // 备选字符 static final char di
读《研磨设计模式》-代码笔记-组合模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; abstract class Component { public abstract void printStruct(Str
利用cmd命令将.class文件打包成jar chenyu19891124 cmd jar
cmd命令打jar是如下实现：在运行里输入cmd，利用cmd命令进入到本地的工作盘符。(如我的是D盘下的文件有此路径 D:\workspace\prpall\WEB-INF\classes) 现在是想把D:\workspace\prpall\WEB-INF\classes路径下所有的文件打包成prpall.jar。然后继续如下操作： cd D: 回车 cd workspace/prpal
[原创]JWFD v0.96 工作流系统二次开发包 for Eclipse 简要说明 comsci eclipse 设计模式算法工作 swing
JWFD v0.96 工作流系统二次开发包 for Eclipse 简要说明 &nb
SecureCRT右键粘贴的设置 daizj secureCRT 右键粘贴
一般都习惯鼠标右键自动粘贴的功能，对于SecureCRT6.7.5 ，这个功能也已经是默认配置了。老版本的SecureCRT其实也有这个功能，只是不是默认设置，很多人不知道罢了。菜单： Options->Global Options ...->Terminal 右边有个Mouse的选项块。 Copy on Select Paste on Right/Middle
Linux 软链接和硬链接 dongwei_6688 linux
1.Linux链接概念Linux链接分两种，一种被称为硬链接（Hard Link），另一种被称为符号链接（Symbolic Link）。默认情况下，ln命令产生硬链接。【硬连接】硬连接指通过索引节点来进行连接。在Linux的文件系统中，保存在磁盘分区中的文件不管是什么类型都给它分配一个编号，称为索引节点号(Inode Index)。在Linux中，多个文件名指向同一索引节点是存在的。一般这种连
DIV底部自适应 dcj3sjt126com JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
Centos6.5使用yum安装mysql——快速上手必备 dcj3sjt126com mysql
第1步、yum安装mysql [root@stonex ~]# yum -y install mysql-server 安装结果： Installed: mysql-server.x86_64 0:5.1.73-3.el6_5 &nb
如何调试JDK源码 frank1234 jdk
相信各位小伙伴们跟我一样，想通过JDK源码来学习Java，比如collections包，java.util.concurrent包。可惜的是sun提供的jdk并不能查看运行中的局部变量，需要重新编译一下rt.jar。下面是编译jdk的具体步骤： 1.把C:\java\jdk1.6.0_26\sr
Maximal Rectangle hcx2013 max
Given a 2D binary matrix filled with 0's and 1's, find the largest rectangle containing all ones and return its area. public class Solution { public int maximalRectangle(char[][] matrix)
Spring MVC测试框架详解——服务端测试 jinnianshilongnian spring mvc test
随着RESTful Web Service的流行，测试对外的Service是否满足期望也变的必要的。从Spring 3.2开始Spring了Spring Web测试框架，如果版本低于3.2，请使用spring-test-mvc项目（合并到spring3.2中了）。 Spring MVC测试框架提供了对服务器端和客户端（基于RestTemplate的客户端）提供了支持。 &nbs
Linux64位操作系统（CentOS6.6）上如何编译hadoop2.4.0 liyong0802 hadoop
一、准备编译软件 1.在官网下载jdk1.7、maven3.2.1、ant1.9.4，解压设置好环境变量就可以用。环境变量设置如下：（1）执行vim /etc/profile （2）在文件尾部加入: export JAVA_HOME=/home/spark/jdk1.7 export MAVEN_HOME=/ho
StatusBar 字体白色 pangyulei status
[[UIApplication sharedApplication] setStatusBarStyle:UIStatusBarStyleLightContent]; /*you'll also need to set UIViewControllerBasedStatusBarAppearance to NO in the plist file if you use this method
如何分析Java虚拟机死锁 sesame java thread oracle 虚拟机 jdbc
英文资料： Thread Dump and Concurrency Locks Thread dumps are very useful for diagnosing synchronization related problems such as deadlocks on object monitors. Ctrl-\ on Solaris/Linux or Ctrl-B
位运算简介及实用技巧（一）：基础篇 tw_wangzhengquan 位运算
http://www.matrix67.com/blog/archives/263 去年年底写的关于位运算的日志是这个Blog里少数大受欢迎的文章之一，很多人都希望我能不断完善那篇文章。后来我看到了不少其它的资料，学习到了更多关于位运算的知识，有了重新整理位运算技巧的想法。从今天起我就开始写这一系列位运算讲解文章，与其说是原来那篇文章的follow-up，不如说是一个r
jsearch的索引文件结构 yangshangchuan 搜索引擎 jsearch 全文检索信息检索 word分词
jsearch是一个高性能的全文检索工具包，基于倒排索引，基于java8，类似于lucene，但更轻量级。 jsearch的索引文件结构定义如下： 1、一个词的索引由=分割的三部分组成：第一部分是词第二部分是这个词在多少

【2012百度之星/资格赛】H:用户请求中的品牌 [后缀数组]

你可能感兴趣的:(后缀数组)