网址:https://vjudge.net/problem/POJ-2752
题意:
给定若干字符串(这些字符串总长 ≤ $400000$ ),在每个字符串中求出所有既是前缀又是后缀的子串长度。
例如:$ababcababababcabab$,既是前缀又是后缀的:$ab$,$abab$,$ababcabab$,$ababcababababcabab$。
题解:
使用$kmp$算法。我们知道$next[i]$是$i$之前的子字符串中相同前缀和后缀的最长长度。则可以这么考虑:从$next[str.size()]$开始,$next[str.size()]$的值就是整个字符串前缀和后缀的最长长度,令其为$k$,$len$为$str.size()$,则$0$~$k-1$和$len-k$~$len-1$都一样。则这个是答案。然后因为$0$~$k-1==len-k$~$len-1$,令$len=k$,则对于这个$0$~$k-1$子字符串中,其必存在和原字符串相同的后缀。
如果$k>len/2$则$len-k$~$k-1$在前后缀中重叠。如$abcabcabc$,能推出字符串一定存在一个以上周期且非重叠部分各占一个周期。
如果$k=len/2$则刚好两个周期。
如果$k<len/2$则在$0$~$k-1$的子串中,存在和原字符串后缀相同的后缀。
然后一直递归令$len=k;k=next[len]$直到$k==0$,逆序输出即得结果。
AC代码:
#include <iostream> #include <string> #include <cstring> using namespace std; int nextarray[400005]; int ans[400005]; void getnext(string &str) { memset(nextarray, 0, sizeof(nextarray)); int j = -1, k = 0; nextarray[0] = -1; while (k < str.size()) { if (j == -1 || str[j] == str[k]) nextarray[++k] = ++j; else j = nextarray[j]; } } void solve(string &str) { int i = 0, j = str.size(); memset(ans, 0, sizeof(ans)); ans[i++] = str.size(); while (nextarray[j]) { ans[i++] = nextarray[j]; j = nextarray[j]; } for (int k = i - 1; k >= 0; --k) { cout << ans[k]; if (k > 0) cout << " "; } cout << endl; } int main() { string a; while (cin >> a) { getnext(a); solve(a); } return 0; }