KMP算法是一个字符串匹配算法,最直白的用法就是在一个长度为n的字符串T中查找另一个长度为m字符串P的匹配(总之就是用于文本中进行单个字符串的匹配)。
对于这个问题,暴力算法是很好做的,直接对于T的每个位置判断一下当前位置作为P的结尾是否可以匹配成功,算法复杂度是O(nm)。
KMP算法的主要思想是:假设现在正在用P的第j个字符和T的第i个字符进行匹配,如果成功就匹配下一个字符;如果失败的话就跳到 以j-1个字符为结尾的后缀的 最长相同前缀的结尾 后一个位置进行匹配。为此要把P做成一个状态机(也就是失配函数),在上面根据情况进行转移。
复杂分析:每一次i增加的时候伴随着j的增加,i增加的时候为j提供了减少的空间,因此j最多会减少n次。加上预处理的时间,总时间复杂度O(n+m)。(这次一定要好好记住,之前看一次忘一次。。。)
下面给出上面问题的代码(n<=1000000,m<=10000)。
1 #include<iostream> 2 #include<cstdio> 3 #include<cstring> 4 #include<cstdlib> 5 #include<algorithm> 6 #include<cmath> 7 #include<queue> 8 #include<set> 9 #include<map> 10 #include<vector> 11 #include<cctype> 12 using namespace std; 13 const int maxn=1000005; 14 const int maxm=10005; 15 16 int N,f[maxn]; 17 char P[maxm],T[maxn]; 18 19 void getfail(char *p) 20 { 21 f[0]=f[1]=0; 22 int m=strlen(p); 23 for(int i=1;i<m;i++){ 24 int j=f[i]; 25 while(j&&p[i]!=p[j]) j=f[j]; 26 f[i+1]=p[i]==p[j]?j+1:0; 27 } 28 } 29 int find(char *t,char *p) 30 { 31 getfail(p); 32 int j=0,re=0,m=strlen(p),n=strlen(t); 33 for(int i=0;i<n;i++){ 34 while(j&&t[i]!=p[j]) j=f[j]; 35 if(t[i]==p[j]) j++; 36 if(j==m) re++,j=f[j]; 37 } 38 return re; 39 } 40 int main() 41 { 42 scanf("%d ",&N); 43 for(int i=1;i<=N;i++){ 44 gets(P);gets(T); 45 printf("%d ",find(T,P)); 46 } 47 return 0; 48 }
Trie是一种可以让你欢快的在字典中查找单词的数据结构,所以单次查询时间复杂度为什么是O(1)。。。。。。
下面的代码是这样一个问题:给出一个长字符串和一些字典中的单词,问用这些单词拼接出长字符串的方案数mod20071027答案是多少,单词可以重复使用。倒着插入所有字典之后dp就可以了。
1 #include<iostream> 2 #include<cstdio> 3 #include<cstring> 4 #include<cstdlib> 5 #include<algorithm> 6 #include<cmath> 7 #include<queue> 8 #include<set> 9 #include<map> 10 #include<vector> 11 #include<cctype> 12 using namespace std; 13 const int maxn=1000005; 14 const int maxm=105; 15 const int mo=20071027; 16 17 int N,f[maxn]; 18 char T[maxn],S[maxm]; 19 struct Trie{ 20 static const int maxnd=4000005; 21 static const int sigma_size=26; 22 int np,ch[maxnd][sigma_size],val[maxnd]; 23 Trie(){ np=0,val[0]=0; memset(ch[0],0,sizeof(ch[0])); } 24 void insert(char *s) 25 { 26 int now=0,i=strlen(s)-1; 27 while(i>=0){ 28 if(!ch[now][s[i]-'a']){ 29 ch[now][s[i]-'a']=++np; 30 memset(ch[np],0,sizeof(ch[np])); 31 val[np]=0; 32 } 33 now=ch[now][s[i--]-'a']; 34 } 35 val[now]++; 36 } 37 int find(int i) 38 { 39 int now=0,re=0; 40 while(i>0){ 41 if(!ch[now][T[i]-'a']) break; 42 now=ch[now][T[i--]-'a']; 43 if(val[now]) re=(re+f[i])%mo; 44 } 45 if(!i&&val[ch[now][T[i]-'a']]) re=(re+1)%mo; 46 return re; 47 } 48 }trie; 49 50 void data_in() 51 { 52 gets(T); scanf("%d ",&N); 53 for(int i=1;i<=N;i++){ 54 gets(S); 55 trie.insert(S); 56 } 57 } 58 void work() 59 { 60 int n=strlen(T); 61 for(int i=0;i<n;i++) f[i]=trie.find(i); 62 printf("%d ",f[n-1]); 63 } 64 int main() 65 { 66 data_in(); 67 work(); 68 return 0; 69 }