RMQ算法

1. 概述

RMQ(Range Minimum/Maximum Query),即区间最值查询,是指这样一个问题:对于长度为n的数列A,回答若干询问RMQ(A,i,j)(i,j<=n),返回数列A中下标在i,j之间的最小/大值。这两个问题是在实际应用中经常遇到的问题,下面介绍一下解决这两种问题的比较高效的算法。当然,该问题也可以用线段树(也叫区间树)解决,算法复杂度为:O(N)~O(logN),这里我们暂不介绍。

2.RMQ算法
对于该问题,最容易想到的解决方案是遍历,复杂度是O(n)。但当数据量非常大且查询很频繁时,该算法无法在有效的时间内查询出正解。
本节介绍了一种比较高效的在线算法(ST算法)解决这个问题。所谓在线算法,是指用户每输入一个查询便马上处理一个查询。该算法一般用较长的时间做预处理,待信息充足以后便可以用较少的时间回答每个查询。ST(Sparse Table)算法是一个非常有名的在线处理RMQ问题的算法,它可以在O(nlogn)时间内进行预处理,然后在O(1)时间内回答每个查询。

(一)首先是预处理,用动态规划(DP)解决。
设A[i]是要求区间最值的数列,F[i, j]表示从第i个数起连续2^j个数中的最大值。(DP的状态)
例如:
A数列为:3 2 4 5 6 8 1 2 9 7
F[1,0]表示第1个数起,长度为2^0=1的最大值,其实就是3这个数。同理 F[1,1] = max(3,2) = 3, F[1,2]=max(3,2,4,5) = 5,F[1,3] = max(3,2,4,5,6,8,1,2) = 8;
并且我们可以容易的看出F[i,0]就等于A[i]。(DP的初始值)
这样,DP的状态、初值都已经有了,剩下的就是状态转移方程。
我们把F[i,j]平均分成两段(因为f[i,j]一定是偶数个数字),从 i 到i + 2 ^ (j - 1) - 1为一段,i + 2 ^ (j - 1)到i + 2 ^ j - 1为一段(长度都为2 ^ (j - 1))。用上例说明,当i=1,j=3时就是3,2,4,5 和 6,8,1,2这两段。F[i,j]就是这两段各自最大值中的最大值。于是我们得到了状态转移方程F[i, j]=max(F[i,j-1], F[i + 2^(j-1),j-1])。
代码如下:
 
[cpp] view plaincopy
void RMQ(int num) //预处理->O(nlogn)  
{  
    for(int j = 1; j < 20; ++j)  
        for(int i = 1; i <= num; ++i)  
            if(i + (1 << j) - 1 <= num)  
            {  
                maxsum[i][j] = max(maxsum[i][j - 1], maxsum[i + (1 << (j - 1))][j - 1]);  
                minsum[i][j] = min(minsum[i][j - 1], minsum[i + (1 << (j - 1))][j - 1]);  
            }  
}  

这里我们需要注意的是循环的顺序,我们发现外层是j,内层是i,这是为什么呢?可以是i在外,j在内吗?

答案是不可以。因为我们需要理解这个状态转移方程的意义。
状态转移方程的含义是:先更新所有长度为F[i,0]即1个元素,然后通过2个1个元素的最值,获得所有长度为F[i,1]即2个元素的最值,然后再通过2个2个元素的最值,获得所有长度为F[i,2]即4个元素的最值,以此类推更新所有长度的最值。
而如果是i在外,j在内的话,我们更新的顺序就是F[1,0],F[1,1],F[1,2],F[1,3],表示更新从1开始1个元素,2个元素,4个元素,8个元素(A[0],A[1],....A[7])的最值,这里F[1,3] = max(max(A[0],A[1],A[2],A[3]),max(A[4],A[5],A[6],A[7]))的值,但是我们根本没有计算max(A[0],A[1],A[2],A[3])和max(A[4],A[5],A[6],A[7]),所以这样的方法肯定是错误的。

为了避免这样的错误,一定要好好理解这个状态转移方程所代表的含义。

(二)然后是查询。
假如我们需要查询的区间为(i,j),那么我们需要找到覆盖这个闭区间(左边界取i,右边界取j)的最小幂(可以重复,比如查询5,6,7,8,9,我们可以查询5678和6789)。
因为这个区间的长度为j - i + 1,所以我们可以取k=log2( j - i + 1),则有:RMQ(A, i, j)=max{F[i , k], F[ j - 2 ^ k + 1, k]}。
举例说明,要求区间[2,8]的最大值,k = log2(8 - 2 + 1)= 2,即求max(F[2, 2],F[8 - 2 ^ 2 + 1, 2]) = max(F[2, 2],F[5, 2]);

在这里我们也需要注意一个地方,就是<<运算符和+-运算符的优先级。
比如这个表达式:5 - 1 << 2是多少?

答案是:4 * 2 * 2 = 16。所以我们要写成5 - (1 << 2)才是5-1 * 2 * 2 = 1。


3.线段树方法
线段树能在对数时间内在数组区间上进行更新与查询。 
定义线段树在区间[i, j] 上如下: 
第一个节点维护着区间 [i, j] 的信息。 
if i<j , 那么左孩子维护着区间[i, (i+j)/2] 的信息,右孩子维护着区间[(i+j)/2+1, j] 的信息。 
可知 N  个元素的线段树的高度 为 [logN] + 1(只有根节点的树高度为0) . 
下面是区间 [0, 9]  的一个线段树: 

RMQ算法_第1张图片 

线段树和堆有一样的结构, 因此如果一个节点编号为 x ,那么左孩子编号为2*x  右孩子编号为2*x+1. 

使用线段树解决RMQ问题,关键维护一个数组M[num],num=2^(线段树高度+1). 
M[i]:维护着被分配给该节点(编号:i 线段树根节点编号:1)的区间的最小值元素的下标。 该数组初始状态为-1. 

Cpp代码   收藏代码
  1. #include<iostream>  
  2.   
  3. using namespace std;  
  4.   
  5. #define MAXN 100  
  6. #define MAXIND 256 //线段树节点个数  
  7.   
  8. //构建线段树,目的:得到M数组.  
  9. void initialize(int node, int b, int e, int M[], int A[])  
  10. {  
  11.     if (b == e)  
  12.         M[node] = b; //只有一个元素,只有一个下标  
  13.     else  
  14.     {  
  15.     //递归实现左孩子和右孩子  
  16.         initialize(2 * node, b, (b + e) / 2, M, A);  
  17.         initialize(2 * node + 1, (b + e) / 2 + 1, e, M, A);  
  18.     //search for the minimum value in the first and  
  19.     //second half of the interval  
  20.     if (A[M[2 * node]] <= A[M[2 * node + 1]])  
  21.         M[node] = M[2 * node];  
  22.     else  
  23.         M[node] = M[2 * node + 1];  
  24.     }  
  25. }  
  26.   
  27. //找出区间 [i, j] 上的最小值的索引  
  28. int query(int node, int b, int e, int M[], int A[], int i, int j)  
  29. {  
  30.     int p1, p2;  
  31.   
  32.   
  33.     //查询区间和要求的区间没有交集  
  34.     if (i > e || j < b)  
  35.         return -1;  
  36.   
  37.     //if the current interval is included in  
  38.     //the query interval return M[node]  
  39.     if (b >= i && e <= j)  
  40.         return M[node];  
  41.   
  42.     //compute the minimum position in the  
  43.     //left and right part of the interval  
  44.     p1 = query(2 * node, b, (b + e) / 2, M, A, i, j);  
  45.     p2 = query(2 * node + 1, (b + e) / 2 + 1, e, M, A, i, j);  
  46.   
  47.     //return the position where the overall  
  48.     //minimum is  
  49.     if (p1 == -1)  
  50.         return M[node] = p2;  
  51.     if (p2 == -1)  
  52.         return M[node] = p1;  
  53.     if (A[p1] <= A[p2])  
  54.         return M[node] = p1;  
  55.     return M[node] = p2;  
  56.   
  57. }  
  58.   
  59.   
  60. int main()  
  61. {  
  62.     int M[MAXIND]; //下标1起才有意义,保存下标编号节点对应区间最小值的下标.  
  63.     memset(M,-1,sizeof(M));  
  64.     int a[]={3,1,5,7,2,9,0,3,4,5};  
  65.     initialize(1, 0, sizeof(a)/sizeof(a[0])-1, M, a);  
  66.     cout<<query(1, 0, sizeof(a)/sizeof(a[0])-1, M, a, 0, 5)<<endl;  
  67.     return 0;  
  68. }  




你可能感兴趣的:(RMQ算法)