作者:Dong | 新浪微博:西成懂 | 可以转载, 但必须以超链接形式标明文章原始出处和作者信息及版权声明
网址:http://dongxicheng.org/structure/lca-rmq/
本博客的文章集合:http://dongxicheng.org/recommend/
以下内容转载自(董的博客)(http://dongxicheng.org/structure/lca-rmq/)
RMQ(Range Minimum/Maximum Query),即区间最值查询,是指这样一个问题:对于长度为n的数列A,回答若干询问RMQ(A,i,j)(i,j<=n),返回数列A中下标在i,j之间的最小/大值。这两个问题是在实际应用中经常遇到的问题,本文介绍了当前解决这两种问题的比较高效的算法。
2、 RMQ算法
对于该问题,最容易想到的解决方案是遍历,复杂度是O(n)。但当数据量非常大且查询很频繁时,该算法也许会存在问题。
本节介绍了一种比较高效的在线算法(ST算法)解决这个问题。所谓在线算法,是指用户每输入一个查询便马上处理一个查询。该算法一般用较长的时间做预处理,待信息充足以后便可以用较少的时间回答每个查询。ST(Sparse Table)算法是一个非常有名的在线处理RMQ问题的算法,它可以在O(nlogn)时间内进行预处理,然后在O(1)时间内回答每个查询。
首先是预处理,用动态规划(DP)解决。设A[i]是要求区间最值的数列,F[i, j]表示从第i个数起连续2^j个数中的最大值。例如数列3 2 4 5 6 8 1 2 9 7,F[1,0]表示第1个数起,长度为2^0=1的最大值,其实就是3这个数。 F[1,2]=5,F[1,3]=8,F[2,0]=2,F[2,1]=4……从这里可以看出F[i,0]其实就等于A[i]。这样,DP的状态、初值都已经有了,剩下的就是状态转移方程。我们把F[i,j]平均分成两段(前一半和后一半)(因为f[i,j]一定是偶数个数字,因为f[i,j]表从i开始长度为2^j个的最大值,即他的个数一定为2^j,平分后每个的个数都为2^(j-1)),前一半的长度为2^(j-1),下标为从i到i+2^(j-1)-1,即F[i,j-1];后一段的长度也为2^(j-1),下标为i+2^(j-1)到i+2^j-1,即F[i + 2^(j-1),j-1]。用上例说明,当i=1,j=3时就是3,2,4,5 和 6,8,1,2这两段。F[i,j]就是这两段的最大值中的最大值。于是我们得到了动态规划方程F[i, j]=max(F[i,j-1], F[i + 2^(j-1),j-1])。
下面的MAX[][]就是F[][].
/st算法 动态规划 初始化 max min
for(int i=1;i<=N;i++)
{
MAX[i][0]=a[i];
MIN[i][0]=a[i];
}
//用动态规划计算其他的值,但是要注意,这里
//循环应该先循环列,在循环行(即j的循环应该在外围,i的循环应该在里面)原因是比如,MAX[1][3]=max(MAX[1][2]+MAX[4][2]),
//在计算MAX[1][3],就要用到MAX[1][2],和MAX[4][2],而如果先循环行i的话,就回使用到还没有计算的值,最终的值一定会出错。
for( int j=1;j<=(log(N)/log(2));j++)
{
for(int i=1;i<=N-pow(2,j)+1;i++)//注意i下标的范围见下面讲解
{
MAX[i][j]=max(MAX[i][j-1],MAX[i+(int)pow(2,j-1)][j-1]);
MIN[i][j]=min(MIN[i][j-1],MIN[i+(int)pow(2,j-1)][j-1]);
}
}
for(int i=1;i<=n;++i)
{
scanf("%d",&FMAX[i][0]);
FMIN[i][0]=FMAX[i][0];
}
for(int i=1;i!=20;i++)
for(int j=1;j<=n;j++)
if(j+(1<<i)-1<=n)
{
FMAX[j][i]=max(FMAX[j][i-1],FMAX[j+(1<<(i-1))][i-1]);
FMIN[j][i]=min(FMIN[j][i-1],FMIN[j+(1<<(i-1))][i-1]);
}
然后是查询。取k=[log2(j-i+1)],则有:RMQ(A, i, j)=max{F[i,k],F[j-2^k+1,k]}。 举例说明,要求区间[2,8]的最大值,就要把它分成[2,5]和[5,8]两个区间,因为这两个区间的最大值我们可以直接由f[2,2]和f[5,2]得到。(f[2,2]表示 从2开始长度为2^2=4 的最大数,即a[2~5]的最大数 ,同理 f[5,2]是 a[5~8]的最大数)
所以有RMQ(A, i, j)=max{F[i,k],F[j-2^k+1,k]}
代码为:
for(int i=0;i"%d%d",&m,&n);
k=(int)(log(n-m+1)/log(2));
e=max(MAX[m][k],MAX[n-(int)pow(2,k)+1][k]);
f=min(MIN[m][k],MIN[n-(int)pow(2,k)+1][k]);
printf("%d\n",e-f);
}
当然,该问题也可以用线段树(也叫区间树)解决,算法复杂度为:O(N)~O(logN),具体可阅读这篇文章:《数据结构之线段树》。http://dongxicheng.org/structure/segment-tree/