小Hi和小Ho正在进行一项基因工程实验。他们要修改一段长度为N的DNA序列,使得这段DNA上最前面的K个碱基组成的序列与最后面的K个碱基组成的序列完全一致。
例如对于序列"ATCGATAC"和K=2,可以通过将第二个碱基修改为"C"使得最前面2个碱基与最后面两个碱基都为"AC"。当然还存在其他修改方法,例如将最后一个碱基改为"T",或者直接将最前面两个和最后面两个碱基都修改为"GG"。
小Hi和小Ho希望知道在所有方法中,修改碱基最少的方法需要修改多少个碱基。
Input第一行包含一个整数T(1 <= T <= 10),代表测试数据的数量。
每组测试数据包含2行,第一行是一个由"ATCG"4个大写字母组成的长度为N(1 <= N <= 1000)的字符串。第二行是一个整数K(1 <= K <= N)。
Output对于每组数据输出最少需要修改的碱基数量。
Sample Input
2
ATCGATAC
2
ATACGTCT
6
Sample Output
1 3
题目大意 :有一串碱基对,求给你一个k值,通过最少变换是的前k个和后k个碱基对排序相同。
题目分析 :比赛的时候觉得挺容易的,但是就是过不去。结果考完,才发现自己跳到了坑里面。分析一下,存在三种情况,分别是有重叠,无重叠
和超出范围--这个条件我就忘记了。无重叠的和超范围的就不说了,很容易判断。主要是重叠如何计算,重叠的最前面和最后面存在一个len-k的长
度,所以把总长度len分为n个len-k的长度。第一个len-k长度影响这第二个len-k,第二个有影响第三个,所以我们不断遍历所有的n个len-k长
度。(在这里我们要弄清楚,第一个len-k的长度也是可以变得,我们需要找到所有的len-k的长度中,和其它匹配后尽可能多的相同)。
题目收获 :太死板不可行,思维出来的时候,不一定用模拟来做题,还可以继续深入,看能不能用数学的或更好的方法解题。
#include <iostream> #include <algorithm> #include <cstdio> #include <cstring> #define maxn 1000+5 using namespace std; char origial[maxn]; int fup[ma xn]; int Ys(int k,int len)//无重叠 { int ans = 0; for (int i = 0; i < k; i++) { if (origial[i] != origial[len + i - k]) ans++; } return ans; } int Ns(int k,int len)//有重叠 { int slen = len - k;//每个单位的长度 int ans, max, sum = 0; if (slen == 0)//单位长度为本身 return sum; for (int i = 0; i < slen; i++)//单位长度中遍历 { max = 0, ans = 0; memset(fup, 0, sizeof(fup)); for (int j = i; j < len; j+=slen)//找到每个单位中相同位置的字符 { fup[origial[j] - 'A']++;//标记字符出现的次数 ans++;//单位长度,即可交换的次数 if (max < fup[origial[j] - 'A'])//找到重复最多的字符 max = fup[origial[j] - 'A']; } sum += (ans - max);//可交换次数-重复最多数=所需最小交换数 } return sum; } int main() { freopen("out.txt", "r", stdin); int t; scanf("%d", &t); while (t--) { memset(origial, '0', sizeof(origial)); scanf("%s", origial); int len = strlen(origial); int k = 0; scanf("%d", &k); if (2 * k > len) { if (k > len) printf("0 "); else printf("%d ", Ns(k, len)); } else printf("%d ", Ys(k, len)); } return 0; }
AC代码: