• CF1063FString Journey【SAM,线段树】


    正题

    题目链接:https://www.luogu.com.cn/problem/CF1063F


    题目大意

    给出一个字符串,求选出\(k\)个不交子串满足按照起始位置排序后,满足下一个是上一个的真子串。

    \(k\)的最大值。

    \(1\leq n\leq 5\times 10^5\)


    解题思路

    首先我们肯定是从短串考虑到长串的,为了方便我们先把字符串翻转一下。

    然后考虑一个性质,肯定存在一个最优解的字符串集合是长度每次增加\(1\)的,显然因为如果增加超过\(1\),我们统一删掉这个位置往后的字符串的一段后缀也是合法的。

    那么现在长度和答案就可以统一了,设\(f_{i}\)表示以\(i\)结尾的前缀(且最后一个串也以\(i\)结尾)的答案。

    那么对于一个\(f_i\)答案的字符集我们把每个串的最后一个字符删去,可以作为\(f_{i-1}\)的答案,所以有\(f_{i-1}\geq f_{i}-1\),也就是\(f_i\)每次最多增加\(1\),那么我们现在就可以暴力处理每个\(f_i\)可能的取值了。

    至于一个\(f_i=x\)时该如何判断答案是否正确,也就是字符串\([i-x+1,i]\)能否作为答案,因为子串集长度是每次加\(1\)的,所以上一个只有可能是\([i-x+2,i]\)或者\([i-x+1,i-1]\),我们只需要考虑所有这些串的答案就好了。考虑用SAM,对于每个处理出来的答案\(f_i\)我们可以加入到\(pos_i\)(也就是前缀\([1,i]\)对应的\(SAM\)节点处),然后查询时直接查询子串\([l,r]\)对应节点子树内的最大\(f_i\)即可(因为显然\(f_i\)能做到的\(f_{i}-1\)也能做到,所以我们只需要查询后缀相同的最大值即可)

    时间复杂度:\(O(n\log n)\)


    code

    #include<cstdio>
    #include<cstring>
    #include<algorithm>
    #include<vector>
    using namespace std;
    const int N=1e6+10,R=20;
    int n,pos[N],f[N][R],g[N],rfn[N],ed[N];
    int cnt,last,fa[N],len[N],ch[N][26];
    char s[N];vector<int> G[N];
    struct SegTree{
    	int w[N<<2];
    	void Change(int x,int L,int R,int pos,int val){
    		if(L==R){w[x]=max(w[x],val);return;}
    		int mid=(L+R)>>1;
    		if(pos<=mid)Change(x*2,L,mid,pos,val);
    		else Change(x*2+1,mid+1,R,pos,val);
    		w[x]=max(w[x*2],w[x*2+1]);return;
    	}
    	int Ask(int x,int L,int R,int l,int r){
    		if(L==l&&R==r)return w[x];
    		int mid=(L+R)>>1;
    		if(r<=mid)return Ask(x*2,L,mid,l,r);
    		if(l>mid)return Ask(x*2+1,mid+1,R,l,r);
    		return max(Ask(x*2,L,mid,l,mid),Ask(x*2+1,mid+1,R,mid+1,r));
    	}
    }T;
    void Ins(int c){
    	int p=last,np=last=++cnt;
    	len[np]=len[p]+1;
    	for(;p&&!ch[p][c];p=fa[p])ch[p][c]=np;
    	if(!p)fa[np]=1;
    	else{
    		int q=ch[p][c];
    		if(len[p]+1==len[q])fa[np]=q;
    		else{
    			int nq=++cnt;len[nq]=len[p]+1;
    			memcpy(ch[nq],ch[q],sizeof(ch[nq]));
    			fa[nq]=fa[q];fa[q]=fa[np]=nq;
    			for(;p&&ch[p][c]==q;p=fa[p])ch[p][c]=nq;
    		}
    	}
    	return;
    }
    void dfs(int x){
    	rfn[x]=++cnt;
    	for(int i=0;i<G[x].size();i++)
    		f[G[x][i]][0]=x,dfs(G[x][i]);
    	ed[x]=cnt;return;
    }
    int getf(int x,int l){
    	for(int i=R-1;i>=0;i--)
    		if(len[f[x][i]]>=l)x=f[x][i];
    	return x;
    }
    bool check(int i){
    	int x=getf(pos[i],g[i]-1);
    	if(T.Ask(1,1,cnt,rfn[x],ed[x])>=g[i]-1)return 1;
    	x=getf(pos[i-1],g[i]-1);
    	if(T.Ask(1,1,cnt,rfn[x],ed[x])>=g[i]-1)return 1;
    	return 0;
    }
    int main()
    {
    	scanf("%d",&n);
    	scanf("%s",s+1);
    	reverse(s+1,s+1+n);
    	cnt=last=1;
    	for(int i=1;i<=n;i++)
    		Ins(s[i]-'a'),pos[i]=last;
    	for(int i=2;i<=cnt;i++)
    		G[fa[i]].push_back(i);
    	cnt=0;dfs(1);
    	for(int j=1;j<R;j++)
    		for(int i=1;i<=cnt;i++)
    			f[i][j]=f[f[i][j-1]][j-1];
    	int z=1,ans=0;
    	for(int i=1;i<=n;i++){
    		g[i]=g[i-1]+1;
    		while(g[i]>1&&!check(i)){
    			T.Change(1,1,cnt,rfn[pos[z]],g[z]);
    			g[i]--;z++;
    		}
    		ans=max(ans,g[i]);
    	}
    	printf("%d\n",ans);
    	return 0;
    }
    
  • 相关阅读:
    DataFrame的iloc与loc的区别是什么?
    [笔记]《算法图解》第十一章 接下来如何做
    [笔记]《算法图解》第十章 K最近邻算法
    leetcode NO.171 Excel表列序号 (python实现)
    [笔记]《算法图解》第九章 动态规划
    [笔记]《算法图解》第八章 贪婪算法
    [笔记]《算法图解》第七章 狄克斯特拉算法
    leetcode NO.7 反转整数 (python3实现)
    [错误处理]电脑风扇很响处理方案
    比对两文件夹下文件名的区别
  • 原文地址:https://www.cnblogs.com/QuantAsk/p/15916075.html
Copyright © 2020-2023  润新知