| Powered By HeartFireY | Sparse-table |
| 需要的前导知识:倍增 |
可重复贡献问题是对于运算 o p t opt opt,运算的性质满足 x o p t x = x x\ opt\ x\ =\ x x opt x = x,则对应的区间询问就是一个可重复的贡献问题,例如:最大值满足 m a x ( x , x ) = x max(x, x) = x max(x,x)=x,最大公因数满足 g c d ( x , x ) = x gcd(x, x) = x gcd(x,x)=x,因此RMQ问题和GCD问题就是一个可重复贡献的问题,但是例如区间和就不满足这个性质,因为在求解区间和的过程中采用的预处理区间会发生重叠,导致重叠部分被重复计算,因此对于 o p t opt opt操作还需要满足集合率才能够使用ST表进行求解。
ST表是一种基于倍增思想,用于解决可重复贡献问题的数据结构。
ST表应用最广泛的领域便是解决RMQ问题:给定 n n n个数, m m m个询问,对于每个询问,需要回答区间 [ l , r ] [l, r] [l,r]中的最大值或最小值(可以采用两个数组同时进行处理)。
基于倍增的思想,ST表可以实现 O ( n l o g n ) O(n log n) O(nlogn)下进行预处理,并在 0 ( 1 ) 0(1) 0(1)时间内回答每个询问。如果仅仅进行区间最值查询,ST表的效率完全吊打线段树;但是,相比于线段树,ST表并不支持修改操作,无论是单点修改还是区间修改都不支持。
我们在简介中提到,ST表基于倍增的思想,但并不是朴素的倍增方式:对于朴素的倍增方式,我们可以发现查询的过程中,我们仍然需要调 2 i 2^i 2i步,那么查询的复杂度显然不是 0 ( 1 ) 0(1) 0(1),也不存在比线段树更有的说法,反倒预处理不如线段树快。
❓::那么倍增的思想是如何应用的呢?
我们在简介前提到了重复贡献问题,显然对于区间的最小值/最大值都满足这个性质: m i n ( x , x ) = x , m a x ( x , x ) = x min(x,x) = x,\ max(x, x) = x min(x,x)=x, max(x,x)=x。那么显然用来求解的预处理的区间有重叠部分,只要这些区间的并是所求区间,最终计算出的答案一定就是正确答案。
❓::具体是如何实现的?
我们定义 f [ i ] [ j ] f[i][j] f[i][j]表示区间 [ i , i + 2 j − 1 ] [i, i + 2^j - 1] [i,i+2j−1]的最大值,那么显然 f [ i ] [ 0 ] = a i f[i][0] = a_i f[i][0]=ai。
那么我们可以根据倍增的思路给出状态转移方程: f ( i , j ) = m a x ( f ( i , j − 1 ) , f ( i + 2 j − 1 , j − 1 ) ) f(i, j) = max(f(i, j - 1),\ f(i + 2^{j - 1},j-1)) f(i,j)=max(f(i,j−1), f(i+2j−1,j−1))
而对于询问 [ l , r ] [l, r] [l,r],我们将其分成两部分 f [ l , l + 2 s − 1 ] f[l, l + 2^s - 1] f[l,l+2s−1]和 f [ r − 2 s + 1 , r ] f[r - 2^s + 1, r] f[r−2s+1,r],即为两个子区间。由于RMQ属于可重复贡献问题,因此不必使两个区间不相交。
但显然,我们需要使第一个字区间的右端点尽可能的接近 r r r,那么不妨直接令 l + 2 s − 1 = r l + 2^s - 1 = r l+2s−1=r,那么可以得到 s = log 2 ( r − l + 1 ) s = \log_2{(r - l + 1)} s=log2(r−l+1);同时,我们希望第二个区间的左端点尽可能地接近 l l l,也就是 r − 2 s + 1 = l r - 2^s + 1 = l r−2s+1=l,发现于上一个式子使完全相同的,因此只需要取 s = log 2 ( r − l + 1 ) s = \log_2{(r -l + 1)} s=log2(r−l+1)即可。但显然这样的 s s s不是整数,那么我们直接取向下取整即可,此时的 s s s仍能保证两个子区间完全覆盖整个区间。
由于使用STL反复计算 l o g log log值容易卡 l o g log log,对于 s s s我们只需预处理出可能用到的全部 s s s值即可:
{ L o g n [ 1 ] = 0 , L o g n [ i ] = L o g n [ i 2 ] + 1. \left\{\begin{aligned} Logn[1] &=0, \\ Logn\left[i\right] &=Logn[\frac{i}{2}] + 1. \end{aligned}\right. ⎩⎨⎧Logn[1]Logn[i]=0,=Logn[2i]+1.
ST表的其他应用
除 RMQ 以外,还有其它的“可重复贡献问题”。例如“区间按位和”、“区间按位或”、“区间 GCD”,ST 表都能高效地解决。
需要注意的是,对于“区间 GCD”,ST 表的查询复杂度并没有比线段树更优(令值域为 w w w,ST 表的查询复杂度为 Θ ( log w ) \Theta(\log w) Θ(logw),而线段树为 Θ ( log n + log w ) \Theta(\log n+\log w) Θ(logn+logw),且值域一般是大于 n n n 的),但是 ST 表的预处理复杂度也没有比线段树更劣,而编程复杂度方面 ST 表比线段树简单很多。
如果分析一下,“可重复贡献问题”一般都带有某种类似 RMQ 的成分。例如“区间按位与”就是每一位取最小值,而“区间 GCD”则是每一个质因数的指数取最小值。
#include
using namespace std;
#define N 2000010
int stmax[N][22], stmin[N][22], mn[N],a[N];
int q, n;
void init(){
mn[0] = -1;
for (int i = 1; i <= n; i++){
mn[i] = ((i & (i - 1)) == 0) ? mn[i - 1] + 1 : mn[i - 1];
stmax[i][0] = stmin[i][0] = a[i];
}
for (int j = 1; j <= mn[n]; j++)
for (int i = 1; i + (1 << j) - 1 <= n; i++){
stmax[i][j] = max(stmax[i][j - 1], stmax[i + (1 << (j - 1))][j - 1]);
stmin[i][j] = min(stmin[i][j - 1], stmin[i + (1 << (j - 1))][j - 1]);
}
}
inline int rmq_max(int L, int R){
int k = mn[R - L + 1];
return max(stmax[L][k], stmax[R - (1 << k) + 1][k]);
}
inline int rmq_min(int L, int R){
int k = mn[R - L + 1];
return min(stmin[L][k], stmin[R - (1 << k) + 1][k]);
}
signed main(){
cin >> n >> q;
for(int i = 1; i <= n; i++) cin >> a[i];
init();
while(q--){
int l, r; cin >> l >> r;
cout << rmq_max(l, r) << rmq_min(l, r) << endl;
}
return 0;
}