1、一些概念
子序列:就是将原序列中的0个或多个元素去掉之后得到的序列。子序列不一定在原序列中连续。比如:X={A,B,D,A,B,C}中的一个子序列可以为:{A,D,B},也可以是: {B,D,B,C}。
2、问题描述
现有两个序列分别为:X={x1,x2,...,xm}和Y={y1,y2,...,yn}.求X和Y的长度最大的公共子序列。
3、问题解析
要寻找X和Y的最长公共子序列,可以从前往后找,也可以从后向前找,若存在多个长度相同的最长公共子序列,则这两种方法找出来的序列可能不一样,但都是最长的公共子序列。
现在主要介绍从后向前找的方法,从前向后找也类似。对于两个序列X和Y,长度分别为:len1和len2,假设其最长公共子序列为Z,其长度为len,查找过程如下:
1)若x[len1]==y[len2],则将x[len1]赋给z[len],然后X和Y同时向前移动一个位置。
2)若X[len1]!=Y[len2],且X[len1] != Z[len],这时X[len1-1]和Y的最长公共子序列为Z。
3)若X[len1] != Y[len2],且Y[len2] != Z[len],这时X和Y[len2-1]的最长公共子序列为Z。
在此,我们使用数组C[i, j]来表示X[i]和Y[j]的最长公共子序列的长度。则Z的长度为C[len1, len2]。根据以上分析,我们可以得出
if i==0 or j==0, 则c[i, j]=0;
if i,j >0 且xi == yj,则c[i, j] = c[i-1, j-1]+1;
if i,j >0 且xi != yj,则c[i, j] = max{c[i-1, j], c[i, j-1];
4、代码实现如下:
<span style="font-size:18px;">#include <stdio.h> #include <string.h> int c[1024][1024]; int lcs_length(char *str1, char *str2, int len1, int len2) { int maxlen, i, j; int m = len1>len2?len1:len2; for(i=0; i<m; i++) { c[i][0] = 0; c[0][i] = 0; } //bottom --> up for(i=1; i<=len1; i++) for(j=1; j<=len2; j++) { if(str1[i-1] == str2[j-1]) { c[i][j] = c[i-1][j-1]+1; } else if(c[i-1][j] > c[i][j-1]) { c[i][j] = c[i-1][j]; } else { c[i][j] = c[i][j-1]; } } maxlen = c[len1][len2]; return maxlen; } //Time: O(len1+len2) void lcs_print(char *str1, int len1, int len2) { if(len1 ==0 || len2 == 0) return ; if(c[len1][len2] == c[len1-1][len2]) { lcs_print(str1, len1-1, len2); } else if(c[len1][len2] == c[len1][len2-1]) { lcs_print(str1, len1, len2-1); } else { lcs_print(str1, len1-1, len2-1); printf("%c",str1[len1-1]); //lcs_print(str1, len1-1, len2-1); } } int main() { freopen("in.lcs", "r", stdin); int maxlen, len1, len2; char str1[1024], str2[1024]; while(scanf("%s %s", str1, str2) == 2) { len1 = strlen(str1); len2 = strlen(str2); maxlen = lcs_length(str1, str2, len1, len2); printf("lcs: %d ",maxlen); lcs_print(str1, len1, len2); printf(" "); } return 0; } </span>