HihoCoder#1052:基因工程
时间限制:1000ms
单点时限:1000ms
内存限制:256MB
描述
小Hi和小Ho正在进行一项基因工程实验。他们要修改一段长度为N的DNA序列,使得这段DNA上最前面的K个碱基组成的序列与最后面的K个碱基组成的序列完全一致。
例如对于序列"ATCGATAC"和K=2,可以通过将第二个碱基修改为"C"使得最前面2个碱基与最后面两个碱基都为"AC"。当然还存在其他修改方法,例如将最后一个碱基改为"T",或者直接将最前面两个和最后面两个碱基都修改为"GG"。
小Hi和小Ho希望知道在所有方法中,修改碱基最少的方法需要修改多少个碱基。
输入
第一行包含一个整数T(1 <= T <= 10),代表测试数据的数量。
每组测试数据包含2行,第一行是一个由"ATCG"4个大写字母组成的长度为N(1 <= N <= 1000)的字符串。第二行是一个整数K(1 <= K <= N)。
输出
对于每组数据输出最少需要修改的碱基数量。
样例输入
2
ATCGATAC
2
ATACGTCT
6
样例输出
1
3
貌似自己很少做这种没有任何提示的题,之前做的也都感觉很简单。
话说人家的技术博客全是技术总结,我这怎么全是个人感受呢?
字符串操作题目,我自己是把情况分成了两种,如果输入的数字*2还小于等于字符串的长度,这种比较简单,从前往后比较即可,有多少个不同,result就加多少。
复杂的在后一种,比方说
ABCDAB
4
这种比较是
ABCD
与CDAB比较
实际上就是字符串中的
0位与2位
1位与3位
2位与4位
3位与5位
比较。
之后的想法是把0 2 4 这样的分成一组,1 3 5这样的分成一组,因为这些的值都要相等,比如0 2 4位分别是A C A,只需把2中的C变为A就行,实际上就是在这个组中要想相等就要少数服从多数,所以对于每组来说,求出每组出线最多的元素的次数,总的元素数-最多的次数,意思就是让其他组员屈服,都等于我的值。
代码:
#include <iostream> #include <string> #include <cstring> #include <vector> #include <algorithm> #include <iterator> using namespace std; string test; int fenge; int R(vector<char> a) { int start=a.size(); int count; int b[27]; memset(b,0,sizeof(b)); int max=0; for(count=0;count<start;count++) { b[a[count]-'A']++; if( b[a[count]-'A']>max) max=b[a[count]-'A']; } return start-max; } void jiandan() { int start = test.length()-fenge; int count; int result=0; for(count=0;count<fenge;count++,start++)//找最多元素的出现的次数 { if(test[count]!=test[start]) { result++; } } cout<<result<<endl; } void fuza() { int start=test.length()-fenge; int len=test.length(); int fenshu=len-fenge; int count; vector<char> a; int result=0; for(count=0;count<fenshu;count++) { int temp = count; while(temp<len)//分组,一组中的元素要统一相等 { a.push_back(test[temp]); temp=temp+fenshu; } result+=R(a); a.clear(); } cout<<result<<endl; } int main() { int count; cin>>count; while(count--) { cin>>test; cin>>fenge; if(test.length()>=2*fenge) { jiandan(); } else { fuza(); } } return 0; }
版权声明:本文为博主原创文章,未经博主允许不得转载。