http://poj.org/problem?id=3261 (题目链接)
题意
给出n个数和k,求在给出的数中,最长的出现至少k次的可重叠子串。
solution
后缀数组论文题,感觉分组思想可能会有大用。
果断后缀数组,求出${sa,height,rank}$。二分答案,每次判断长度${mid}$是否符合出现${k}$次的要求。那么现在的问题是如何判断是否有一个长度为${mid}$的子串在原串中出现了至少${k}$次。
我们采用分组思想。将后缀${sa}$按照${height}$是否大于等于${mid}$连续的分成若干组,若存在某一组中的后缀数大于等于${k}$,那么就是符合要求。
蒯个论文图:
代码
// poj3261 #include<algorithm> #include<iostream> #include<cstdlib> #include<cstring> #include<vector> #include<cstdio> #include<cmath> #include<set> #define LL long long #define inf 1<<30 #define Pi acos(-1.0) #define free(a) freopen(a".in","r",stdin),freopen(a".out","w",stdout); using namespace std; const int maxn=1000010; int n,K,sa[maxn],rank[maxn],height[maxn],a[maxn]; namespace Suffix { int wa[maxn],wb[maxn],ww[maxn]; bool cmp(int *r,int a,int b,int l) { return r[a]==r[b] && r[a+l]==r[b+l]; } void da(int *r,int *sa,int n,int m) { int i,j,p,*x=wa,*y=wb; for (i=0;i<=m;i++) ww[i]=0; for (i=1;i<=n;i++) ww[x[i]=r[i]]++; for (i=1;i<=m;i++) ww[i]+=ww[i-1]; for (i=n;i>=1;i--) sa[ww[x[i]]--]=i; for (p=0,j=1;p<n;j*=2,m=p) { for (p=0,i=n-j+1;i<=n;i++) y[++p]=i; for (i=1;i<=n;i++) if (sa[i]>j) y[++p]=sa[i]-j; for (i=0;i<=m;i++) ww[i]=0; for (i=1;i<=n;i++) ww[x[y[i]]]++; for (i=1;i<=m;i++) ww[i]+=ww[i-1]; for (i=n;i>=1;i--) sa[ww[x[y[i]]]--]=y[i]; for (swap(x,y),x[sa[1]]=p=1,i=2;i<=n;i++) x[sa[i]]=cmp(y,sa[i-1],sa[i],j) ? p : ++p; } } void calheight(int *r,int *sa,int n) { for (int i=1;i<=n;i++) rank[sa[i]]=i; for (int k=0,i=1;i<=n;i++) { if (k) k--; int j=sa[rank[i]-1]; while (r[i+k]==r[j+k]) k++; height[rank[i]]=k; } } } bool check(int mid) { int t=1; for (int i=2;i<=n;i++) { if (height[i]>=mid) t++; else { if (t>=K) return 1; else t=1; } } return t>=K; } int main() { scanf("%d%d",&n,&K); for (int i=1;i<=n;i++) scanf("%d",&a[i]); Suffix::da(a,sa,n,1000000); Suffix::calheight(a,sa,n); int l=0,r=n,ans=0; while (l<=r) { int mid=(l+r)>>1; if (check(mid)) ans=mid,l=mid+1; else r=mid-1; } printf("%d",ans); return 0; }