P4112 [HEOI2015]最短不公共子串
题目描述
在虐各种最长公共子串、子序列的题虐的不耐烦了之后,你决定反其道而行之。
一个串的“子串”指的是它的连续的一段,例如bcd是abcdef的子串,但bde不是。
一个串的“子序列”指的是它的可以不连续的一段,例如bde是abcdef的子串,但bdd不是。
下面,给两个小写字母串A,B,请你计算:
(1) A的一个最短的子串,它不是B的子串
(2) A的一个最短的子串,它不是B的子序列
(3) A的一个最短的子序列,它不是B的子串
(4) A的一个最短的子序列,它不是B的子序列
输入输出格式
输入格式:
有两行,每行一个小写字母组成的字符串,分别代表A和B。
输出格式:
输出4行,每行一个整数,表示以上4个问题的答案的长度。如果没有符合要求的答案,输出-1
说明
对于20%的数据,A和B的长度都不超过20
对于50%的数据,A和B的长度都不超过500
对于100%的数据,A和B的长度都不超过2000
四合一还行。
问题1
建立B的后缀自动机
枚举A的开头,然后在B上从S向后跑,失配了更新答案
问题2
建立B的序列自动机
然后一样的
问题3
在B的后缀自动机上跑DP(这样才能处理A的子序列)
具体的(dp_i)表示这个点可以匹配上的最短长度
从头开始枚举每个点更新。
问题4
在B的序列自动机上跑,其他和三一样
数据太水,3,4的dp01背包写成完全背包也可以过...
我3的dp写的是假的,懒得改了..
Code:
#include <cstdio>
#include <cstring>
const int N=4010;
const int inf=0x3f3f3f3f;
char s1[N],s2[N];
int n,dp[N];
int min(int x,int y){return x<y?x:y;}
struct SuffixAutomata
{
int tot,las,len[N],ch[N][26],par[N];
SuffixAutomata()
{
tot=las=1;
memset(len,0,sizeof(len));
memset(ch,0,sizeof(ch));
memset(par,0,sizeof(par));
}
void extend(int c)
{
int now=++tot,p=las;
len[now]=len[p]+1;
while(p&&!ch[p][c]) ch[p][c]=now,p=par[p];
if(!p) par[now]=1;
else
{
int x=ch[p][c];
if(len[x]==len[p]+1) par[now]=x;
else
{
int y=++tot;
len[y]=len[p]+1,par[y]=par[x];
memcpy(ch[y],ch[x],sizeof ch[y]);
while(p&&ch[p][c]==x) ch[p][c]=y,p=par[p];
par[now]=par[x]=y;
}
}
las=now;
}
void build(char *s)
{
int n=strlen(s+1);
for(int i=1;i<=n;i++) extend(s[i]-'a');
}
}T1;
struct SequentialAutomaton
{
int suc[N],ch[N][26];
SequentialAutomaton()
{
memset(suc,0,sizeof(suc));
memset(ch,0,sizeof(ch));
}
void build(char *s)
{
int n=strlen(s+1);s[0]='a';
for(int i=n;~i;i--)
{
for(int j=0;j<26;j++)
if(suc[j])
ch[i][j]=suc[j];
suc[s[i]-'a']=i;
}
}
}T2;
void work1()
{
int ans=inf;
for(int i=1;i<=n;i++)
{
int now=1;
for(int j=i;j<=n;j++)
{
int c=s1[j]-'a';
if(T1.ch[now][c]) now=T1.ch[now][c];
else
{
ans=min(ans,j+1-i);
break;
}
}
}
if(ans==inf) puts("-1");
else printf("%d
",ans);
}
void work2()
{
int ans=inf;
for(int i=1;i<=n;i++)
{
int now=0;
for(int j=i;j<=n;j++)
{
int c=s1[j]-'a';
if(T2.ch[now][c]) now=T2.ch[now][c];
else
{
ans=min(ans,j+1-i);
break;
}
}
}
if(ans==inf) puts("-1");
else printf("%d
",ans);
}
void work3()
{
memset(dp,0x3f,sizeof dp);
dp[1]=0;
int ans=inf;
for(int i=1;i<=n;i++)
{
int c=s1[i]-'a';
for(int j=1;j<=T1.tot;j++)
{
int v=T1.ch[j][c];
if(v) dp[v]=min(dp[v],dp[j]+1);
else ans=min(ans,dp[j]+1);
}
}
if(ans==inf) puts("-1");
else printf("%d
",ans);
}
void work4()
{
memset(dp,0x3f,sizeof dp);
dp[0]=0;
int ans=inf;
for(int i=1;i<=n;i++)
{
int c=s1[i]-'a';
for(int j=n;~j;j--)
{
int v=T2.ch[j][c];
if(v) dp[v]=min(dp[v],dp[j]+1);
else ans=min(ans,dp[j]+1);
}
}
if(ans==inf) puts("-1");
else printf("%d
",ans);
}
int main()
{
scanf("%s%s",s1+1,s2+1);
T1.build(s2),T2.build(s2),n=strlen(s1+1);
work1(),work2(),work3(),work4();
return 0;
}
2019.1.7