正题
题目链接:https://www.luogu.com.cn/problem/P6793
题目大意
给出两个长度为\(n\)的字符串,取出他们所有长度为\(k\)的连续子串分别构成两个可重集合\(A,B\)。
你每次可以花费\(x\)点代价修改\(A\)中一个字符串长度为\(x\)的后缀,求至少花费多少代价能够使得两个集合完全相同。
\(1\leq k\leq n\leq 1.5\times 10^5\)
解题思路
两个串\(S,T\)的匹配代价是\(max\{k-LCP(S,T),0\}\)
这个和之前有道题很像,沿用想法就是在后缀树上搞。
两个点的\(LCP\)可以在他们后缀树上的\(LCA\)处得到。
现在问题就变为了有一些黑白点,知道两个点匹配的代价与\(LCA\)的关系,求最小代价和。
基础贪心?直接在深度小的地方合并完就好了。
后缀树就是把反串跑广义SAM就好了
时间复杂度\(O(n)\)
code
#include<cstdio>
#include<cstring>
#include<algorithm>
#define ll long long
using namespace std;
const ll N=6e5+10;
struct node{
ll to,next;
}a[N];
ll n,k,tot,ls[N],v[N][2],ans;
ll ch[N][26],fa[N],len[N],cnt;
char sa[N],sb[N];
ll Insert(ll p,ll c){
if(ch[p][c]){
ll q=ch[p][c];
if(len[p]+1==len[q])return q;
ll nq=++cnt;len[nq]=len[p]+1;
memcpy(ch[nq],ch[q],sizeof(ch[nq]));
fa[nq]=fa[q];fa[q]=nq;
for(;p&&ch[p][c]==q;p=fa[p])ch[p][c]=nq;
return nq;
}
ll np=++cnt;len[np]=len[p]+1;
for(;p&&!ch[p][c];p=fa[p])ch[p][c]=np;
if(!p)fa[np]=1;
else{
ll q=ch[p][c];
if(len[p]+1==len[q])fa[np]=q;
else{
ll nq=++cnt;len[nq]=len[p]+1;
memcpy(ch[nq],ch[q],sizeof(ch[nq]));
fa[nq]=fa[q];fa[q]=fa[np]=nq;
for(;p&&ch[p][c]==q;p=fa[p])ch[p][c]=nq;
}
}
return np;
}
void addl(ll x,ll y){
a[++tot].to=y;
a[tot].next=ls[x];
ls[x]=tot;return;
}
void dfs(ll x){
for(ll i=ls[x];i;i=a[i].next){
ll y=a[i].to;dfs(y);
v[x][0]+=v[y][0];
v[x][1]+=v[y][1];
}
ll tmp=min(v[x][0],v[x][1]);
ans+=max(k-len[x],0ll)*tmp;
v[x][0]-=tmp;v[x][1]-=tmp;
return;
}
signed main()
{
scanf("%lld%lld",&n,&k);
scanf("%s",sa+1);
scanf("%s",sb+1);
ll last=cnt=1;
for(ll i=n;i>=1;i--)
last=Insert(last,sa[i]-'a'),v[last][0]+=((n-i+1)>=k);
last=1;
for(ll i=n;i>=1;i--)
last=Insert(last,sb[i]-'a'),v[last][1]+=((n-i+1)>=k);
for(ll i=2;i<=cnt;i++)addl(fa[i],i);
dfs(1);
printf("%lld\n",ans);
return 0;
}