hdu4622
后缀数组基础题?
昨天学了后缀排序其实最有用的是后缀数组求 l c p lcp lcp?
用了一个 h e i g h t [ i ] = l c p ( s a [ i ] , s a [ i − 1 ] ) height[i]=lcp(sa[i],sa[i-1]) height[i]=lcp(sa[i],sa[i−1]),也就是排名为 i i i的和排名 i − 1 i-1 i−1的后缀的 l c p lcp lcp
为了方便,设 h [ i ] = h e i g h t ( r k [ i ] ) h[i]=height(rk[i]) h[i]=height(rk[i])就是 i i i位置的后缀和它前一名的后缀的 l c p lcp lcp
有几个性质:
h [ i ] ≥ h [ i − 1 ] + 1 h[i]\ge h[i-1]+1 h[i]≥h[i−1]+1,证明可以感性理解一下,把 i − 1 i-1 i−1和它的上一名同时去掉第一位就是 h [ i ] h[i] h[i]
有了这个就可以快速求出 h h h数组:
inline void geth(){
int j,k=0;
for(int i=1;i<=n;i++){
if(k) --k;
j=sa[rk[i]-1];
while(s[i+k]==s[j+k]) ++k;
h[rk[i]]=k;
}
}
还有 l c p ( i , j ) = m i n i + 1 ≤ k ≤ j ( h [ k ] ) lcp(i,j)=min_{i+1\le k\le j}(h[k]) lcp(i,j)=mini+1≤k≤j(h[k])
这个也可以感性理解一下,手动模拟之类的
有了这个就可以快速求出 l c p lcp lcp,这道题中套一个 s t st st表求区间最小值就好了
inline int query(int l,int r){
int k=log2(r-l+1);
return min(st[l][k],st[r-(1<<k)+1][k]);
}
//st表,区间min
inline int lcp(int l,int r){
if(l>r) swap(l,r);
return query(l+1,r);
}
然后再回来看这道题,区间 [ l , r ] [l,r] [l,r]本质不同的子串其实就是所有后缀的长度减去它和之前后缀的 l c p lcp lcp,因为它的 l c p lcp lcp是之前出现过的,然后后面每加一个字符就可以产生一个新的。
而且因为后缀排序的特性,不会出现某两个排名 i , j , k ( i < j < k ) i,j,k(i<j<k) i,j,k(i<j<k)且 l c p ( i , k ) > l c p ( j , k ) lcp(i,k)>lcp(j,k) lcp(i,k)>lcp(j,k),所以这个方法是正确的
最后放代码:
#include
#include
#include
#include
#include
#include
#define maxn 2005
using namespace std;
inline int rd(){
int x=0,f=1;char c=' ';
while(c<'0' || c>'9') f=c=='-'?-1:1,c=getchar();
while(c<='9' && c>='0') x=x*10+c-'0',c=getchar();
return x*f;
}
int t,n,m,q,sa[maxn],rk[maxn],tp[maxn],tax[maxn],h[maxn],st[maxn][12];
char s[maxn];
inline void rsort(){
for(int i=1;i<=m;i++) tax[i]=0;
for(int i=1;i<=n;i++) ++tax[rk[i]];
for(int i=1;i<=m;i++) tax[i]+=tax[i-1];
for(int i=n;i;i--) sa[tax[rk[tp[i]]]--]=tp[i];
}
//基数排序
inline void ssort(){
for(int i=1;i<=n;i++) rk[i]=s[i],tp[i]=i;
rsort();
for(int w=1,p=0;p<n && w<=n;w<<=1,m=p){
p=0;
for(int i=n-w+1;i<=n;i++) tp[++p]=i;
for(int i=1;i<=n;i++)
if(sa[i]>w) tp[++p]=sa[i]-w;
rsort();
swap(rk,tp);
rk[sa[1]]=p=1;
for(int i=2;i<=n;i++)
if(tp[sa[i]]==tp[sa[i-1]] && tp[sa[i]+w]==tp[sa[i-1]+w])
rk[sa[i]]=p;
else rk[sa[i]]=++p;
}
}
//后缀排序
inline void geth(){
int j,k=0;
for(int i=1;i<=n;i++){
if(k) --k;
j=sa[rk[i]-1];
while(s[i+k]==s[j+k]) ++k;
h[rk[i]]=k;
}
}
//求h数组
void prework(){
for(int i=1;i<=n;i++) st[i][0]=h[i];
for(int j=1;(1<<j)<n;j++)
for(int i=1;i+(1<<j)-1<=n;i++)
st[i][j]=min(st[i][j-1],st[i+(1<<(j-1))][j-1]);
}
inline int query(int l,int r){
int k=log2(r-l+1);
return min(st[l][k],st[r-(1<<k)+1][k]);
}
//st表,区间min
inline int lcp(int l,int r){
if(l>r) swap(l,r);
return query(l+1,r);
}
//求lcp,lcp(i,j)=min(h[k]) i+1<=k<=j
inline int ask(int l,int r){
vector<int> pos;
for(int i=1;i<=n;i++)
if(l<=sa[i] && sa[i]<=r) pos.push_back(sa[i]);
int sum=r-pos[0]+1,tmp=sum;//sum:答案,tmp:当前后缀与之前所有后缀的lcp
for(int i=1;i<pos.size();i++){
int k=lcp(rk[pos[i]],rk[pos[i-1]]),len=r-pos[i]+1;//k当前与上一个的lcp
tmp=min(tmp,k);//k
tmp=max(tmp,min(k,r-pos[i-1]+1));//k>tmp,tmp可能为k,但不能超过上一个长度
sum+=len-min(tmp,len);
}
return sum;
}
int main(){
t=rd();
while(t--){
scanf("%s",s+1); n=strlen(s+1); m=127;
ssort(); geth(); prework();
q=rd();
while(q--){
int l=rd(),r=rd();
if(l>r) swap(l,r);
printf("%d\n",ask(l,r));
}
}
return 0;
}