大致题意:
给出n个长度为60的DNA基因(A腺嘌呤 G鸟嘌呤 T胸腺嘧啶 C胞嘧啶)序列,求出他们的最长公共子序列
使用后缀数组解决
1 #include<stdio.h> 2 #include<string.h> 3 char str[6200],res[6200]; 4 int num[6200],loc[6200]; 5 int sa[6200],rank[6200],height[6200]; 6 int wa[6200],wb[6200],wv[6200],wd[6200]; 7 int vis[6200]; 8 int seq_num; 9 int cmp(int *r,int a,int b,int l){ 10 return r[a]==r[b]&&r[a+l]==r[b+l]; 11 } 12 void DA(int *r,int n,int m){ 13 int i,j,p,*x=wa,*y=wb,*t; 14 for(i=0;i<m;i++)wd[i]=0; 15 for(i=0;i<n;i++)wd[x[i]=r[i]]++; 16 for(i=1;i<m;i++)wd[i]+=wd[i-1]; 17 for(i=n-1;i>=0;i--) sa[--wd[x[i]]]=i; 18 for(j=1,p=1;p<n;j*=2,m=p){ 19 for(p=0,i=n-j;i<n;i++) y[p++]=i; 20 for(i=0;i<n;i++) if(sa[i]>=j) y[p++] = sa[i] -j; 21 for(i=0;i<n;i++)wv[i]=x[y[i]]; 22 for(i=0;i<m;i++) wd[i]=0; 23 for(i=0;i<n;i++)wd[wv[i]]++; 24 for(i=1;i<m;i++)wd[i]+=wd[i-1]; 25 for(i=n-1;i>=0;i--) sa[--wd[wv[i]]]=y[i]; 26 for(t=x,x=y,y=t,p=1,x[sa[0]]=0,i=1;i<n;i++){ 27 x[sa[i]]=cmp(y,sa[i-1],sa[i],j)?p-1:p++; 28 } 29 } 30 } 31 void calHeight(int *r,int n){ 32 int i,j,k=0; 33 for(i=1;i<=n;i++)rank[sa[i]]=i; 34 for(i=0;i<n;height[rank[i++]]=k){ 35 for(k?k--:0,j=sa[rank[i]-1];r[i+k]==r[j+k];k++); 36 } 37 } 38 int check(int mid,int len){ 39 int i,j,tot; 40 tot=0; 41 memset(vis,0,sizeof(vis)); 42 for(i=2;i<=len;i++){ 43 if(height[i]<mid){ 44 memset(vis,0,sizeof(vis)); 45 tot=0; 46 }else{ 47 if(!vis[loc[sa[i-1]]]){ 48 vis[loc[sa[i-1]]]=1; 49 tot++; 50 } 51 if(!vis[loc[sa[i]]]){ 52 vis[loc[sa[i]]]=1; 53 tot++; 54 } 55 if(tot==seq_num){ 56 for(j=0;j<mid;j++){ 57 res[j]=num[sa[i]+j]+'A'-1; 58 }res[mid]='