[BZOJ3230]相似子串
试题描述
输入
输入第1行,包含3个整数N,Q。Q代表询问组数。
第2行是字符串S。
接下来Q行,每行两个整数i和j。(1≤i≤j)。
第2行是字符串S。
接下来Q行,每行两个整数i和j。(1≤i≤j)。
输出
输出共Q行,每行一个数表示每组询问的答案。如果不存在第i个子串或第j个子串,则输出-1。
输入示例
5 3 ababa 3 5 5 9 8 10
输出示例
18 16 -1
数据规模及约定
N≤100000,Q≤100000,字符串只由小写字母'a'~'z'组成
题解
把所有后缀排一遍序之后,会发现所有子串的左端点都被提到了一次,那么对于一个后缀,只需要确定哪些右端点是能用的就好了。
发现借助 height 数组可以算出能用的右端点在哪个区间,就是 [len[i] - height[i], len[i]],len[i] 表示排名第 i 个后缀的长度。
这样,我们就知道每个后缀中包含了多少个本质不同的子串了(并且还是按字典序排好的)。
那么对于一个询问 [l, r] 我们二分一下查找到第 l 和第 r 名的子串所在的后缀,然后大力用 ST 表求一波 LCP 就好了。
还需要建立一个反串。
注意输入可能爆 int。
#include <iostream> #include <cstdio> #include <cstring> #include <cstdlib> #include <cctype> #include <algorithm> using namespace std; #define LL long long LL read() { LL x = 0, f = 1; char c = getchar(); while(!isdigit(c)){ if(c == '-') f = -1; c = getchar(); } while(isdigit(c)){ x = x * 10 + c - '0'; c = getchar(); } return x * f; } #define maxn 100010 #define maxlog 17 int Log[maxn]; struct Suf { char S[maxn]; int n, rank[maxn], height[maxn], sa[maxn], Ws[maxn], mnh[maxlog][maxn]; void init(const char* Str) { strcpy(S + 1, Str); n = strlen(S + 1); return ; } bool cmp(int* a, int p1, int p2, int l) { if(p1 + l > n && p2 + l > n) return a[p1] == a[p2]; if(p1 + l > n || p2 + l > n) return 0; return a[p1] == a[p2] && a[p1+l] == a[p2+l]; } void ssort() { int *x = rank, *y = height; int m = 0; for(int i = 1; i <= n; i++) Ws[x[i] = S[i]]++, m = max(m, x[i]); for(int i = 1; i <= m; i++) Ws[i] += Ws[i-1]; for(int i = n; i; i--) sa[Ws[x[i]]--] = i; for(int j = 1, pos = 0; pos < n; j <<= 1, m = pos) { pos = 0; for(int i = n - j + 1; i <= n; i++) y[++pos] = i; for(int i = 1; i <= n; i++) if(sa[i] > j) y[++pos] = sa[i] - j; for(int i = 1; i <= m; i++) Ws[i] = 0; for(int i = 1; i <= n; i++) Ws[x[i]]++; for(int i = 1; i <= m; i++) Ws[i] += Ws[i-1]; for(int i = n; i; i--) sa[Ws[x[y[i]]]--] = y[i]; swap(x, y); pos = 1; x[sa[1]] = 1; for(int i = 2; i <= n; i++) x[sa[i]] = cmp(y, sa[i], sa[i-1], j) ? pos : ++pos; } return ; } void calch() { for(int i = 1; i <= n; i++) rank[sa[i]] = i; for(int i = 1, j, k = 0; i <= n; height[rank[i++]] = k) for(k ? k-- : 0, j = sa[rank[i]-1]; S[j+k] == S[i+k]; k++); return ; } void rmq_init() { Log[1] = 0; for(int i = 2; i <= n; i++) Log[i] = Log[i>>1] + 1; for(int i = 1; i <= n; i++) mnh[0][i] = height[i]; for(int j = 1; (1 << j) <= n; j++) for(int i = 1; i + (1 << j) - 1 <= n; i++) mnh[j][i] = min(mnh[j-1][i], mnh[j-1][i+(1<<j-1)]); return ; } int que(int l, int r) { if(l > r) swap(l, r); if(l == r) return n - sa[l] + 1; l++; int t = Log[r-l+1]; return min(mnh[t][l], mnh[t][r-(1<<t)+1]); } } sol1, sol2; char inS[maxn]; LL en[maxn]; int rev(int x) { return sol2.rank[sol1.n-sol1.sa[x]+1]; } int main() { int n = read(), q = read(); scanf("%s", inS); sol1.init(inS); for(int i = 0; i < (sol1.n >> 1); i++) swap(inS[i], inS[sol1.n-i-1]); sol2.init(inS); sol1.ssort(); sol1.calch(); sol1.rmq_init(); sol2.ssort(); sol2.calch(); sol2.rmq_init(); for(int i = 1; i <= n; i++) en[i] = n - sol1.sa[i] + 1 - sol1.height[i]; for(int i = 1; i <= n; i++) en[i] += en[i-1]; // for(int i = 1; i <= n; i++) printf("%lld%c", en[i], i < n ? ' ' : ' '); while(q--) { LL l = read(), r = read(); if(l > en[n] || r > en[n]){ puts("-1"); continue; } int prel = lower_bound(en + 1, en + n + 1, l) - en, prer = lower_bound(en + 1, en + n + 1, r) - en, lenl = n - sol1.sa[prel] + 1 - (en[prel] - l), lenr = n - sol1.sa[prer] + 1 - (en[prer] - r); // printf("%d %d [%d %d] [%d %d] ", prel, prer, sol1.sa[prel], sol1.sa[prel] + lenl - 1, sol1.sa[prer], sol1.sa[prer] + lenr - 1); int a = min(sol1.que(prel, prer), min(lenl, lenr)), b = min(sol2.que(sol2.rank[n-sol1.sa[prel]-lenl+2], sol2.rank[n-sol1.sa[prer]-lenr+2]), min(lenl, lenr)); // printf("%d %d ", a, b); printf("%lld ", (LL)a * a + (LL)b * b); } return 0; }