Description
基因匹配(match) 卡卡昨天晚上做梦梦见他和可可来到了另外一个星球,这个星球上生物的DNA序列由无数种碱基排列而成(地球上只有4种),而更奇怪的是,组成DNA序列的 每一种碱基在该序列中正好出现5次!这样如果一个DNA序列有N种不同的碱基构成,那么它的长度一定是5N。 卡卡醒来后向可可叙述了这个奇怪的梦,而可可这些日子正在研究生物信息学中的基因匹配问题,于是他决定为这个奇怪星球上的生物写一个简单的DNA匹配程 序。 为了描述基因匹配的原理,我们需要先定义子序列的概念:若从一个DNA序列(字符串)s中任意抽取一些碱基(字符),将它们仍按在s中的顺序排列成一个新 串u,则称u是s的一个子序列。对于两个DNA序列s1和s2,如果存在一个序列u同时成为s1和s2的子序列,则称u是s1和s2的公共子序列。 卡卡已知两个DNA序列s1和s2,求s1和s2的最大匹配就是指s1和s2最长公共子序列的长度。 [任务] 编写一个程序: 从输入文件中读入两个等长的DNA序列; 计算它们的最大匹配; 向输出文件打印你得到的结果。
Input
输入文件中第一行有一个整数N,表示这个星球上某种生物使用了N种不同的碱基,以后将它们编号为1…N的整数。 以下还有两行,每行描述一个DNA序列:包含5N个1…N的整数,且每一个整数在对应的序列中正好出现5次。
Output
输出文件中只有一个整数,即两个DNA序列的最大匹配数目。
Sample Input
2
1 1 2 2 1 1 2 1 2 2
1 2 2 2 1 1 2 2 1 1
1 1 2 2 1 1 2 1 2 2
1 2 2 2 1 1 2 2 1 1
Sample Output
7
HINT
[数据约束和评分方法]
60%的测试数据中:1<=N <= 1 000
100%的测试数据中:1<=N <= 20 000
正解:DP+树状数组优化前缀最大值+滚动数组
解题报告:
这道题原型是道DP裸题,朴素DP显然是O(N^2)的,但我们考虑这道题有很多可以利用的地方。首先每个字符确定出现5次,显然我们不需要每个字符都去进行比较,只需要预处理一下相等的之前的位置在哪里。然后因为朴素转移式子是:f[i][j]=f[i][j-1]; if(a[i]==b[j]) f[i][j]=max(f[i][j],f[i-1][j-1]+1); 我们可以考虑优化一下这个max操作,相当于是在前面查找一个最大的f然后加一。因为只需要维护前缀最大值,不需要区间减法,所以可以用常数极小,好写好调的树状数组维护前缀最大值f。
然后就可以AC辣。
1 //It is made by jump~ 2 #include <iostream> 3 #include <cstdlib> 4 #include <cstring> 5 #include <cstdio> 6 #include <cmath> 7 #include <algorithm> 8 #include <ctime> 9 #include <vector> 10 #include <queue> 11 #include <map> 12 #include <set> 13 #ifdef WIN32 14 #define OT "%I64d" 15 #else 16 #define OT "%lld" 17 #endif 18 using namespace std; 19 typedef long long LL; 20 #define RG register 21 const int MAXN = 100011; 22 int n,N,ans; 23 int a[MAXN],b[MAXN]; 24 int f[MAXN]; 25 int shu[MAXN]; 26 //转移:f[i][j]=f[i][j-1]; if(a[i]==b[j]) f[i][j]=max(f[i][j],f[i-1][j-1]+1); 27 int w[20011][6]; 28 29 inline int getint() 30 { 31 RG int w=0,q=0; 32 char c=getchar(); 33 while((c<'0' || c>'9') && c!='-') c=getchar(); 34 if (c=='-') q=1, c=getchar(); 35 while (c>='0' && c<='9') w=w*10+c-'0', c=getchar(); 36 return q ? -w : w; 37 } 38 39 inline int query(int x){//树状数组优化前缀最大值 40 RG int total=0; 41 while(x>0) { 42 total=max(shu[x],total); 43 x-=x&(-x); 44 } 45 return total; 46 } 47 48 inline void add(int x,int val){ 49 while(x<=N) { 50 shu[x]=max(shu[x],val); 51 x+=x&(-x); 52 } 53 } 54 55 inline void work(){ 56 n=getint(); N=n*5; 57 for(RG int i=1;i<=N;i++) a[i]=getint(); 58 for(RG int i=1;i<=N;i++) b[i]=getint(),w[b[i]][++w[b[i]][0]]=i; 59 int now; 60 for(RG int i=1;i<=N;i++) { 61 for(RG int j=5;j>=1;j--){ 62 now=query(w[a[i]][j]-1); 63 f[w[a[i]][j]]=max(now+1,f[w[a[i]][j]]); 64 add(w[a[i]][j],f[w[a[i]][j]]); 65 ans=max(ans,f[w[a[i]][j]]); 66 } 67 } 68 printf("%d",ans); 69 } 70 71 int main() 72 { 73 work(); 74 return 0; 75 }