正题
题目链接:https://www.luogu.com.cn/problem/CF1063F
题目大意
给出一个字符串,求选出\(k\)个不交子串满足按照起始位置排序后,满足下一个是上一个的真子串。
求\(k\)的最大值。
\(1\leq n\leq 5\times 10^5\)
解题思路
首先我们肯定是从短串考虑到长串的,为了方便我们先把字符串翻转一下。
然后考虑一个性质,肯定存在一个最优解的字符串集合是长度每次增加\(1\)的,显然因为如果增加超过\(1\),我们统一删掉这个位置往后的字符串的一段后缀也是合法的。
那么现在长度和答案就可以统一了,设\(f_{i}\)表示以\(i\)结尾的前缀(且最后一个串也以\(i\)结尾)的答案。
那么对于一个\(f_i\)答案的字符集我们把每个串的最后一个字符删去,可以作为\(f_{i-1}\)的答案,所以有\(f_{i-1}\geq f_{i}-1\),也就是\(f_i\)每次最多增加\(1\),那么我们现在就可以暴力处理每个\(f_i\)可能的取值了。
至于一个\(f_i=x\)时该如何判断答案是否正确,也就是字符串\([i-x+1,i]\)能否作为答案,因为子串集长度是每次加\(1\)的,所以上一个只有可能是\([i-x+2,i]\)或者\([i-x+1,i-1]\),我们只需要考虑所有这些串的答案就好了。考虑用SAM,对于每个处理出来的答案\(f_i\)我们可以加入到\(pos_i\)(也就是前缀\([1,i]\)对应的\(SAM\)节点处),然后查询时直接查询子串\([l,r]\)对应节点子树内的最大\(f_i\)即可(因为显然\(f_i\)能做到的\(f_{i}-1\)也能做到,所以我们只需要查询后缀相同的最大值即可)
时间复杂度:\(O(n\log n)\)
code
#include<cstdio>
#include<cstring>
#include<algorithm>
#include<vector>
using namespace std;
const int N=1e6+10,R=20;
int n,pos[N],f[N][R],g[N],rfn[N],ed[N];
int cnt,last,fa[N],len[N],ch[N][26];
char s[N];vector<int> G[N];
struct SegTree{
int w[N<<2];
void Change(int x,int L,int R,int pos,int val){
if(L==R){w[x]=max(w[x],val);return;}
int mid=(L+R)>>1;
if(pos<=mid)Change(x*2,L,mid,pos,val);
else Change(x*2+1,mid+1,R,pos,val);
w[x]=max(w[x*2],w[x*2+1]);return;
}
int Ask(int x,int L,int R,int l,int r){
if(L==l&&R==r)return w[x];
int mid=(L+R)>>1;
if(r<=mid)return Ask(x*2,L,mid,l,r);
if(l>mid)return Ask(x*2+1,mid+1,R,l,r);
return max(Ask(x*2,L,mid,l,mid),Ask(x*2+1,mid+1,R,mid+1,r));
}
}T;
void Ins(int c){
int p=last,np=last=++cnt;
len[np]=len[p]+1;
for(;p&&!ch[p][c];p=fa[p])ch[p][c]=np;
if(!p)fa[np]=1;
else{
int q=ch[p][c];
if(len[p]+1==len[q])fa[np]=q;
else{
int nq=++cnt;len[nq]=len[p]+1;
memcpy(ch[nq],ch[q],sizeof(ch[nq]));
fa[nq]=fa[q];fa[q]=fa[np]=nq;
for(;p&&ch[p][c]==q;p=fa[p])ch[p][c]=nq;
}
}
return;
}
void dfs(int x){
rfn[x]=++cnt;
for(int i=0;i<G[x].size();i++)
f[G[x][i]][0]=x,dfs(G[x][i]);
ed[x]=cnt;return;
}
int getf(int x,int l){
for(int i=R-1;i>=0;i--)
if(len[f[x][i]]>=l)x=f[x][i];
return x;
}
bool check(int i){
int x=getf(pos[i],g[i]-1);
if(T.Ask(1,1,cnt,rfn[x],ed[x])>=g[i]-1)return 1;
x=getf(pos[i-1],g[i]-1);
if(T.Ask(1,1,cnt,rfn[x],ed[x])>=g[i]-1)return 1;
return 0;
}
int main()
{
scanf("%d",&n);
scanf("%s",s+1);
reverse(s+1,s+1+n);
cnt=last=1;
for(int i=1;i<=n;i++)
Ins(s[i]-'a'),pos[i]=last;
for(int i=2;i<=cnt;i++)
G[fa[i]].push_back(i);
cnt=0;dfs(1);
for(int j=1;j<R;j++)
for(int i=1;i<=cnt;i++)
f[i][j]=f[f[i][j-1]][j-1];
int z=1,ans=0;
for(int i=1;i<=n;i++){
g[i]=g[i-1]+1;
while(g[i]>1&&!check(i)){
T.Change(1,1,cnt,rfn[pos[z]],g[z]);
g[i]--;z++;
}
ans=max(ans,g[i]);
}
printf("%d\n",ans);
return 0;
}