准备系统的学习一下算法,就先行KMP开始吧!
到目前为止,我能用到KMP的地方有三类题目:
- 给出主串s和模式串t,查找t在s中出现的位置
- 给出主串s和模式串t,查找t在s中出现的次数
- 给出一个字符串t,求t中循环节的个数
KMP算法的时间复杂度是O(n),因为主串s在匹配过程中是不回溯的,KMP算法的巧妙之处在于对模式串的预处理,当模式串的第j个位置与主串第i个位置不匹配的时候,他会回溯到next[j]位置,继续与i匹配,next[]数组就是预处理的失配函数,记录失配时模式串要回溯到的位置。
更加详细的解释网上也有很多详细的资料,这里给出几道基础的题目练练手!
题目: hdu 1711
题意:找出模式串在主串中首次出现的位置
#include<cstdio>
const int N=1e6+5;
int s[N],t[N],slen,tlen;
int next[N];
void getNext()
{
int j,k;
j=0;k=next[0]=-1;
while(j<tlen){
if(k==-1||t[j]==t[k])next[++j]=++k;
else k=next[k];
}
}
int KMP_Index()
{
getNext();
int i,j=0;
for( i=0;i<slen&&j<tlen;i++){
while(j&&s[i]!=t[j])j=next[j];
if(s[i]==t[j])j++;
}
if(j==tlen)return i-tlen+1;
return -1;
}
int main()
{
int T;
//freopen("f.txt","r",stdin);
scanf("%d",&T);
while(T--){
scanf("%d%d",&slen,&tlen);
for(int i=0;i<slen;i++)scanf("%d",&s[i]);
for(int i=0;i<tlen;i++)scanf("%d",&t[i]);
printf("%d
",KMP_Index());
}
return 0;
}
题目:poj 3461
题意:统计模式串在主串中出现的次数
#include<cstdio>
#include<cstring>
const int N=1e6+5;
char s[N],t[N];
int next[N],slen,tlen;
void getNext()
{
int i,j;
i=0;j=next[0]=-1;
while(i<tlen){
if(j==-1||t[i]==t[j])next[++i]=++j;
else j=next[j];
}
}
int KMP_Count()
{
getNext();
int ans=0;
int j=0;
for(int i=0;i<slen;i++){
while(j&&s[i]!=t[j])j=next[j];
if(s[i]==t[j])j++;
if(j==tlen){
ans++;
j=next[j];
}
}
return ans;
}
int main()
{
int T;
scanf("%d",&T);
while(T--){
scanf("%s%s",t,s);
tlen=strlen(t);
slen=strlen(s);
printf("%d
",KMP_Count());
}
}
题目:poj 1961
题意:给一个字符串,找出其中循环节的位置和个数
分析:
这题考察对next数组的理解,next数组记录的是不匹配时要回溯到的位置,例如,当第n个位置不匹配时,要回溯到next[n],中间跳过了t=n-next[n]个数,t就是最小循环节的个数(如果是周期串的话)因为他不匹配了,n之前的t个数与next[n]之前的t个数是匹配的。为什么?因为next数组记录的位置前面肯定是匹配的,这是由next数组的定义决定的。
#include<cstdio>
const int N=1e6+6;
char s[N];
int next[N],slen;
void getNext()
{
int i,j;
i=0;j=next[0]=-1;
while(i<slen){
if(j==-1||s[i]==s[j])next[++i]=++j;
else j=next[j];
}
}
int main()
{
int cas=0;
while(~scanf("%d",&slen)&&slen){
scanf("%s",s);
getNext();
printf("Test case #%d
",++cas);
for(int i=1;i<=slen;i++){
if(i%(i-next[i])==0&&next[i])
printf("%d %d
",i,i/(i-next[i]));
}
for(int i=0;i<=slen;i++)
printf("%d ",next[i]);
printf("
");
}
}