题目链接:http://poj.org/problem?id=2406
这道题在很久之前就做过,由于那时候还没有仔细研究KMP以及对next数组的理解,所以当时也是留下了这个问题,最近《数据结构》上到串,老师提到这个算法,但是没有讲,下来后,我觉得是时候看下这个算法了。
题目大概意思就是求给出的字符串最大循环节。比如“ababab”就是由3个“ab”相连而成,所以输出3,“abcdef”只能看作一个“abcdef”所以输出1。
具体KMP的意义和next数组的学习笔记和理解笔记写在笔记本上,这里我就直接引用其他人的说法:
KMP中next数组的巧妙运用。在这里我们假设这个字符串的长度是len,那么如果len可以被len-next[len]整除的话,我们就可以说len-next[len]就是那个最短子串的长度
为什么呢? 假设我们有一个字符串ababab,那么next[6]=4对吧,由于next的性质是,匹配失败后,下一个能继续进行匹配的位置,也就是说,把字符串的前四个字母,abab,平移2个单位,这个abab一定与原串的abab重合(否则就不满足失败函数的性质),这说明了什么呢,由于字符串进行了整体平移,而平移后又要重叠,那么必有
s[1]=s[3],s[2]=s[4],s[3]=s[5],s[4]=s[6].说明长度为2的字符串在原串中一定重复出现,这就是len-next[len]的含义!
这个说法的确很犀利,很到位。详情理解参照KMP笔记第四页对abab的next[4]=2的运用。
注意的是,next[0]一般人工赋值-1,所以next数组是平移过的,数组下标对应字符串的序号,序号是从1开始,比如ababac,next[6]对应的是c(其实代表ababc),next[5]对应的是a,next在这里对ababac进行模拟下,ababac对应next数组001230,next[6]=0,没有可以平移重叠的模式串的字串,输出1。对ababac的分析看笔记第四第五页。
笔记:
AC代码:
#include<iostream> #include<cstring> #include<cstdio> using namespace std; const int maxn = 1000005; char T[maxn],P[maxn]; int next[maxn],tn,pn,Case; void Makenext(int tn){ int i=0,j=-1; next[0] = -1; while(i<tn){ if(j==-1||P[i]==P[j]) next[++i] = ++j; else j = next[j]; } } int main(){ int k; int cnt; while(~scanf("%s",P)){ if(P[0]=='.') break; tn = strlen(P); Makenext(tn); k = tn-next[tn]; if(tn%k==0) cnt = tn/k; else cnt = 1; printf("%d ",cnt); } return 0; }