构造后缀数组(SA[ ]),即对一个字符串的每个后缀按照字典序排序后得到的数组,在这里采用哈希+二分的方式优化字符串的比较部分,使得复杂度由(O(n^2*logn) ightarrow O(n*log^2n))。
代码如下
#include <bits/stdc++.h>
using namespace std;
const int maxn=1e6+10;
const int base=131;
char s[maxn];
unsigned long long h[maxn],p[maxn];
int height[maxn],sa[maxn],n;
void read_and_parse(){
scanf("%s",s+1);
n=strlen(s+1),p[0]=1;
for(int i=1;i<=n;i++){
sa[i]=i;
p[i]=p[i-1]*base;
h[i]=h[i-1]*base+s[i];
}
}
inline unsigned long long get(int l,int r){
return h[r]-h[l-1]*p[r-l+1];
}
int lcp(int x,int y){//最长公共前缀的模板
int l=0,r=min(n-x+1,n-y+1);
while(l<r){
int mid=l+r+1>>1;
if(get(x,x+mid-1)==get(y,y+mid-1))l=mid;
else r=mid-1;
}
return l;
}
bool cmp(int x,int y){
int l=lcp(x,y);
return s[x+l]<s[y+l];
}
void solve(){
sort(sa+1,sa+n+1,cmp);
for(int i=2;i<=n;i++)height[i]=lcp(sa[i],sa[i-1]);//height 数组是sa[i]和sa[i-1]的lcp数组
for(int i=1;i<=n;i++)printf("%d%c",sa[i],i==n?'
':' ');
for(int i=1;i<=n;i++)printf("%d%c",height[i],i==n?'
':' ');
}
int main(){
read_and_parse();
solve();
return 0;
}