RMQ(Range Minimum/Maximum Query),即区间最值查询,是指这样一个问题:对于长度为n的数列A,回答若干询问RMQ(A,i,j)(i,j<=n),返回数列A中下标在i,j之间的最小/大值。这两个问题是在实际应用中经常遇到的问题。最简单的算法就是对每次查询进行一次遍历,复杂度为O(QN),其中Q为查询的次数。当然有效率更高的算法。RMQ-ST算法。
在线算法(ST算法)解决这个问题。所谓在线算法,是指用户每输入一个查询便马上处理一个查询。该算法一般用较长的时间做预处理,待信息充足以后便可以用较少的时间回答每个查询。ST(Sparse Table)算法是一个非常有名的在线处理RMQ问题的算法,它可以在O(nlogn)时间内进行预处理,然后在O(1)时间内回答每个查询。
首先是预处理,用动态规划(DP)解决。设A[i]是要求区间最值的数列,F[i, j]表示从第i个数起连续2^j个数中的最大值。例如数列3 2 4 5 6 8 1 2 9 7,F[1,0]表示第1个数起,长度为2^0=1的最大值,其实就是3这个数。 F[1,2]=5,F[1,3]=8,F[2,0]=2,F[2,1]=4……从这里可以看出F[i,0]其实就等于A[i]。这样,DP的状态、初值都已经有了,剩下的就是状态转移方程。我们把F[i,j]平均分成两段(因为f[i,j]一定是偶数个数字),从i到i+2^(j-1)-1为一段,i+2^(j-1)到i+2^j-1为一段(长度都为2^(j-1))。用上例说明,当i=1,j=3时就是3,2,4,5 和 6,8,1,2这两段。F[i,j]就是这两段的最大值中的最大值。于是我们得到了动态规划方程F[i, j]=max(F[i,j-1], F[i + 2^(j-1),j-1])。然后是查询,由于给出的区间不一定是2的次幂,所以需要取一个最小幂覆盖区间。取k=[log2(j-i+1)],向上取整,则有:RMQ(A, i, j)=min{F[i,k],F[j-2^k+1,k]},即将区间分为[i,i+(2^k)-1] [j-(2^k)+1,j],容易证明这两个区间是有重合地方的。 举例说明,要求区间[2,8]的最大值,就要把它分成[2,5]和[5,8]两个区间,因为这两个区间的最大值我们可以直接由f[2,2]和f[5,2]得到。
题目详见#1068 : RMQ-ST算法,附上AC代码。
#include <stdio.h> #include <stdlib.h> #include <math.h> #include <fstream> using namespace std; const int N = 10e6+10; const int M = 30; int arrayData[N]; int rmqData[N][M]; int n,m; int min(int x, int y){ return (x <y ? x : y); } void RMQ(){ int i, j; for (i = 0; i < n; i++){ rmqData[i][0] = arrayData[i]; } for (j = 1; j <=m; j++){ for (i = 0; i+(1 << j)-1 <n; i++){ rmqData[i][j] = min(rmqData[i][j - 1], rmqData[i + (1<<(j - 1))][j - 1]); } } } int main(){ scanf("%d", &n); int i, j; for (i = 0; i < n; i++){ scanf("%d", &arrayData[i]); } m = (log(n*1.0) / log(2.0)); RMQ(); int q; scanf("%d", &q); for (i = 0; i < q; i++){ int l, r; scanf("%d%d", &l, &r); l = l - 1; r = r - 1; int k=0; while ((1 << (k + 1)) <= (r - l + 1)) k++; printf("%d ", min(rmqData[l][k], rmqData[r-(1<<k)+1][k])); } return 0; }