问题
参考51nod1304这道题;
很显然我们要求的是S的每个后缀与S的最长公共前缀的长度之和。
暴力
假设我们把next[i]表示为第i个后缀与S的最长公共前缀的长度。
现在我们想了:这个next数组,如果暴力来求的话,时间复杂度是
这是我们回忆一下KMP:KMP物尽其用,然后呢就把求fail的速度提高到了
那么我们在求next数组的时候,可不可以也使用这样的想法来物尽其用,尽可能地去除重复的匹配呢?
答案是肯定的。
引入扩展KMP
假设要处理出S的next数组,现在已经处理出前s的next了。
现在要求出下一个位置x的next。
其中维护一个li,使得
由next[id]的定义,我们知道
推得
如果
于是就有
目前为止,我们很容易看出,x往后的
但我们需要再分类一下:
1.x+next[1+x-id]-1<li
这种情况显然是
因为在li范围内,
所以
2.x+next[1+x-id]-1>=li
这种情况虽然我们可以知道,[x,li]这一段是可以不用匹配的。
但是li以后的情况我们都是未知的。
那么我们暴力匹配来推进li。
于是乎就会有新的
重复上述过程,我们可以求出所有的next。
显然时间复杂度只与li的推进有关,即为
回到本题
使用扩展KMP求出next后,求和即可。
我的博客。
扩展KMP的完全体
事实上本题只是扩展KMP的退化。
扩展KMP可以用于求一个串S的所有后缀与目标串T的最长公共前缀的的长度。
想法与求next数组一样。
设要求的东西叫ext。
其中维护一个li,使得
同理推得
那么依然分类讨论,即可求出ext。
最后贴上一个求next的程序
#include<iostream>
#include<stdio.h>
#include<math.h>
#include<string.h>
#include<algorithm>
#define ll long long
using namespace std;
const char* fin="ex1304.in";
const char* fout="ex1304.out";
const int inf=0x7fffffff;
const int maxn=1000007;
int n,i,j,k,limit,id;
ll ans;
char a[maxn];
int ne[maxn];
int main(){
scanf("%s",a+1);
n=strlen(a+1);
limit=0;
id=0;
ne[1]=n;
for (i=2;i<=n;i++){
j=ne[i-id+1];
if (i+j-1<limit) ne[i]=j;
else{
j=max(0,limit-i+1);
for (;j+i<=n;j++) if (a[i+j]!=a[j+1]) break;
if (i+j-1>limit){
limit=i+j-1;
id=i;
}
ne[i]=j;
}
}
for (i=1;i<=n;i++) ans+=ne[i];
printf("%lld",ans);
return 0;
}