算法基础 - RMQ-ST算法(在线算法)

  • RMQ问题
    • 在线算法
    • 离线算法
    • ST Sparse Table 算法
      • 预处理数据
      • 查询区间
      • 完成代码如下

RMQ问题

RMQ(Range Minimum/Maximum Query),即区间最值查询,是指这样一个问题:对于一个长度N的数组,在多次询问中,每次都以O(1)的时间得到区间[a, b]的最大值或最小值。

在线算法

说来惭愧,到现在才刚开始清楚说的在线算法和离线算法是什么意思,所谓在线算法就是说,每次请求及时处理,处理完之后,直接返回,然后等待处理下一次请求。

所以一般在线算法有个预处理过程,预处理数据之后,能够更快速的处理每次请求的结果,但是会有一个相对长一点的预处理过程。

本文说的ST算法预处理的时间是(NlogN)。

离线算法

所谓离线算法只是在来了非常多的请求之后,一次性处理多个请求,能够不依赖于预处理数据,却能一次完成多个请求的结果。

ST ( Sparse Table ) 算法

ST(Sparse Table)算法是一个非常有名的在线处理RMQ问题的算法,它可以在O(nlogn)时间内进行预处理,然后在O(1)时间内回答每个查询。其思想就是保存以i为起点的某段数据的最小值。

预处理数据

预处理,用动态规划(DP)解决。思想接近于二路归并排序过程的分治思想。

  1. 既然是DP思想,首先要记录每步的状态。
A[i]是要求区间最值的数列,F[i, j]表示从第i个数起连续2^j个数中的最大值。 这里的F[i, j]就是每步的状态。

例如:

A数列为:3 2 4 5 6 8 1 2 9 7

F[1,0]表示第1个数起,长度为2^0=1的最大值,其实就是3这个数。
同理 : F[1,1] = max(3,2) = 3, F[1,2]=max(3,2,4,5) = 5,F[1,3] = max(3,2,4,5,6,8,1,2) = 8;

  1. 状态转移方程
    既然有每步的状态了,开始找状态转移方程。
F[i, j] = max(F[i, j-1], F[i+2^(j-1)][j-1]);

怎么理解呢?

最初始状态:F[0, 0] = A[0]; F[1,0] = A[1]; F[2,0] = A[2]; 意思是说每单个元素的最大值都是自己(因为只有一个元素)

下一个状态:F[0, 1] = max(F[0,0], F[1,0]) = max(A[0], A[1]);意思是说把F[0, 1] 分成两段,例如要求得F[3, 2] = max(A[3] , A[4], A[5], A[6]) 其实就是求四个元素的前两个以及后两个的最大值。在求F[3,2]的时候已经知道了F[3, 1]和F[5,1]了。

代码如下:

void RMQ(int num){
    for (int j = 1; j < 31; j++) {
        for (int i = 0 ; i <= num; i++) {
            if (i + (1<1 <= num) {
                maxNum[i][j] = max(maxNum[i][j-1], maxNum[i+(1<<(j-1))][j-1]);
                minNum[i][j] = min(minNum[i][j-1], minNum[i+(1<<(j-1))][j-1]);
            }
        }
    }
}

查询区间

那么查询怎么做呢?毕竟我们存放的都是2次幂个数的最小值。假如查询的区间是奇数个,或不是2次幂个数怎么弄?

其实很简单,就是把头尾分开!

假如我们需要查询的区间为(i,j),那么我们需要找到小于这个闭区间(左边界取i,右边界取j)的最大幂(可以重复,比如查询5,6,7,8,9,我们可以查询5678和6789)

  1. 区间的长度为j - i + 1
  2. 可以取k=log2( j - i + 1) 区间是1->3 就取 log2( 3 - 1 + 1) = 1小于等于区间的最大幂
  3. RMQ(A, i, j)=max{F[i , k], F[ j - 2 ^ k + 1, k]}

F[i, k] 是右边界起点向左找,F[ j - 2 ^ k + 1, k]是左边界作为终点,向右找起点。 一定要用小于等于区间的最大幂是因为要能够两个F加在一起能够覆盖整个区间。

完成代码如下

//
// main.cpp
// RMQ_ST
//
// Created by Alps on 16/5/17.
// Copyright © 2016年 chen. All rights reserved.
//

#include 
#include 
#include 
#include 
#include 
#include 

#ifndef MAXARR
#define MAXARR 100 //默认数组最多元素
#endif

using namespace std;

int maxNum[MAXARR][32];
int minNum[MAXARR][32];

void RMQ(int num){
    for (int j = 1; j < 31; j++) {
        for (int i = 0 ; i < num; i++) {
            if (i + (1<1 < num) {
                maxNum[i][j] = max(maxNum[i][j-1], maxNum[i+(1<<(j-1))][j-1]);
                minNum[i][j] = min(minNum[i][j-1], minNum[i+(1<<(j-1))][j-1]);
            }
        }
    }
}

int main(int argc, const char * argv[]) {
    int M,N;
    scanf("%d",&M);
    for (int i = 0; i < M; i++) {
        scanf("%d",&maxNum[i][0]);
        minNum[i][0] = maxNum[i][0]; //初始化状态
    }
    RMQ(M);
    scanf("%d",&N); //查询次数
    int start = 0, end = 0;
    for (int i = 0; i < N; i++) {
        scanf("%d%d",&start,&end); //查询的区间
        int k  = log2(end-start+1);
        cout<int)(1<1][k])<//最大值
        cout<int)(1<1][k])<//最小值
    }
    return 0;
}

你可能感兴趣的:(算法基础)