与众不同
题目链接:ybt高效进阶4-3-3 / LOJ 10121
题目大意
给你个数列,然后每次询问一个区间,要你在这里面找一个长度最大的子区间,使得这个子区间里面没有重复的数。
思路
我们考虑先求出以一边为区间右端点,左端点最左可以是哪个。
可以推出 dp 方程:(f_i=max(f_{i-1},last_{a_i}+1))
((last_{a_i}) 是 (a_i)(区间中的数)在前面最后一次在哪里出现,如果前面没有出现过就是 (0),这个可以跟着维护)
然后你就可以求出来 (f_i),然后顺便求出以它为右端点的区间的最长长度。(就是右减最左 (+1))
然后我们考虑如何找到它所有子区间中最小的。
然后我们首先要发现一个性质:(f_i) 序列是不降序列。
那我们想先暴力枚举子区间的右端点,然后会有最前的左端点。
那如果这个左端点在给定区间的左边,那左区间就不能选那么远,最远只能选给定区间的左端点。
那如果不是,就可以直接选它。
那根据我们前面发现的不讲序列,那应该会有一个分界点,使得左边的作为右端点最远的左端点都会超,右边的就不会。
那我们分开讨论。
对于左边,它们的左端点都是一样的(给定区间左端点),那我们就要让右端点最长,那就是分界点前最后一个。
对于右边,它们的右端点和对应的最左左端点都在给定区间内,那我们就对前面求出的最长长度取一个最大值。
然后我们考虑如何优化这个右边的求最大值。
因为数是不会改变(它跟给定区间左右端点无关,只需要在这个区间分界点的右边即可),而且是求区间极值,我们考虑用 ST 表。
至于怎么求分界点,我们可以根据它的单调性(不下降)用二分求出。
那问题就解决了。
代码
#include<cstdio>
#include<iostream>
#define di 1000000
using namespace std;
int n, m, a[200001], last[2000001];
int pre[200001], f[200001][21], x, y, log[200001];
void get_log() {//预处理 log
int now = 1, x = 0;
while ((now << 1) < 200000) {
for (int i = now; i < (now << 1); i++)
log[i] = x;
x++;
now <<= 1;
}
while (now <= 200000) log[now++] = x;
}
int main() {
get_log();
scanf("%d %d", &n, &m);
for (int i = 1; i <= n; i++) {
scanf("%d", &a[i]);
pre[i] = max(pre[i - 1], last[a[i] + di] + 1);//以它为右边左端点最左是哪里
f[i][0] = i - pre[i] + 1;//上面的左端点和右端点组成序列的长度
last[a[i] + di] = i;//维护这个数上次出现的位置
}
for (int i = 1; i <= log[n]; i++)//ST 表合并
for (int j = 1; j <= n; j++)
if (j + (1 << (i - 1)) > n) f[j][i] = f[j][i - 1];
else f[j][i] = max(f[j][i - 1], f[j + (1 << (i - 1))][i - 1]);
for (int i = 1; i <= m; i++) {
scanf("%d %d", &x, &y);
x++;
y++;
int l = x, r = y, ans = x - 1;//二分出分界点
while (l <= r) {
int mid = (l + r) >> 1;
if (pre[mid] < x) ans = mid, l = mid + 1;
else r = mid - 1;
}
if (ans >= y) {//全部都是分界点左边
printf("%d
", ans - x + 1);
continue;
}
int size = log[y - (ans + 1) + 1];//分界点左边直接选最右的长度最大,分界点右边的用 ST 表求最大值
printf("%d
", max(ans - x + 1, max(f[ans + 1][size], f[y - (1 << size) + 1][size])));
}
return 0;
}