题目描述
给出一个由小写英文字母组成的字符串S,再给出q个询问,要求回答S某个子串的最短循环节。
如果字符串B是字符串A的循环节,那么A可以由B重复若干次得到。
输入
第一行一个正整数n (n<=500,000),表示S的长度。
第二行n个小写英文字母,表示字符串S。
第三行一个正整数q (q<=2,000,000),表示询问个数。
下面q行每行两个正整数a,b (1<=a<=b<=n),表示询问字符串S[a..b]的最短循环节长度。
输出
依次输出q行正整数,第i行的正整数对应第i个询问的答案。
样例输入
8
aaabcabc
3
1 3
3 8
4 8
aaabcabc
3
1 3
3 8
4 8
样例输出
1
3
5
3
5
对于一个串的循环节有几个性质,这些性质也是解题的关键所在:
1、如果B串是A串的循环节,那么B串长度一定是A串长度的约数。
2、如果B串是A串的循环节,设A串区间为[l,r],B串长度为x,[l+x,r]和[l,r-x]一定相同(判断循环节的关键所在),这个很好证明,因为A串由几个B拼接而成,从前面拿掉一个B和从后面拿掉一个B,剩下串自然是一样的。
3、如果B串是A串的最短循环节,那么所有A串循环节的长度都是B串长度的倍数,也就是说不是B串长度倍数的一定不是循环节。举个例子:假如A串长度为6(每个字符分别用s1,s2,s3,s4,s5,s6表示),最短循环节长度为2,长度为3的子串一定不是循环节,因为s1=s3=s5,s2=s4=s6且s1≠s2即s1≠s4,但如果长度为3的是循环节,s1=s4,显然矛盾,由此推广就能证明上述结论。
因为一个A串的长度由几个质因子相乘得到,所以只要判断长度除掉某个质因子之后得到的子串是否为循环节,如果是,就说明这个串中是最短循环节的倍数。这里用线性筛法筛质因子,在线性筛素数时记录每个数的最小质因子,每个查询是枚举质因子O(1)判断。
这三道题中有一道卡自然溢出。
最后附上代码。
#include<cstdio> #include<algorithm> #include<iostream> #include<cstring> #include<cmath> #include<queue> #include<map> using namespace std; unsigned long long h[500010]; long long g[500010]; long long m[500010]; unsigned long long k[500010]; const int base=13131; long long mod=2333333333ll; int vis[500010]; int prime[100010]; int s[500010]; char ch[500010]; int n,q; int l,r; int ans; int len; int cnt; void find(int n) { for(int i=2;i<=n;i++) { if(!vis[i]) { prime[++cnt]=i; s[i]=i; } for(int j=1;j<=cnt&&prime[j]*i<=n;j++) { vis[i*prime[j]]=1; s[i*prime[j]]=prime[j]; if(i%prime[j]==0) { break; } } } } bool check(int l,int r,int L,int R) { if((h[r]-h[l-1]*k[r-l+1]==h[R]-h[L-1]*k[R-L+1])&&(((((g[r]-g[l-1]*m[r-l+1]%mod)%mod)+mod)%mod)==((((g[R]-g[L-1]*m[R-L+1]%mod)%mod)+mod)%mod))) { return true; } return false; } int main() { scanf("%d",&n); scanf("%s",ch+1); find(n); m[0]=1; k[0]=1; for(int i=1;i<=n;i++) { h[i]=h[i-1]*base+ch[i]; k[i]=k[i-1]*base; g[i]=(g[i-1]*base%mod+ch[i])%mod; m[i]=m[i-1]*base%mod; } scanf("%d",&q); while(q--) { scanf("%d%d",&l,&r); len=r-l+1; ans=len; for(int i=len;i>1;i/=s[i]) { int num=ans/s[i]; if(check(l,r-num,l+num,r)) { ans=num; } } printf("%d ",ans); } }