• 动态规划求解最长公共子序列问题


    LCS是求两个字符串,最长的公共部分,中间可以间隔其他的元素。例如,字符串s1=''mzjawxu'',s2=''xmjyauz'',仔细分析下,大体可以看出最长公共子序列是''mjau'',我们需要一套科学严格的方法来求解。这个问题是DP问题(动态规划问题)。动态规划问题:就是当前问题的求解依赖于上一个子问题,上一个子问题又依赖于前一个子问题,子问题无限递归。

     

    记:

     

    Xi=﹤x1,⋯,xi﹥即X序列的前i个字符 (1≤i≤m)(前缀)

    Yj=﹤y1,⋯,yj﹥即Y序列的前j个字符 (1≤j≤n)(前缀)

     

    假定Z=﹤z1,⋯,zk﹥∈LCS(X , Y)。

     

    • xm=yn(最后一个字符相同),则不难用反证法证明:该字符必是X与Y的任一最长公共子序列Z(设长度为k)的最后一个字符,即有zk = xm = yn 且显然有Zk-1∈LCS(Xm-1 , Yn-1)即Z的前缀Zk-1是Xm-1与Yn-1的最长公共子序列。此时,问题化归成求Xm-1与Yn-1的LCS(LCS(X , Y)的长度等于LCS(Xm-1 , Yn-1)的长度加1)。

    • xm≠yn,则亦不难用反证法证明:要么Z∈LCS(Xm-1, Y),要么Z∈LCS(X , Yn-1)。由于zk≠xm与zk≠yn其中至少有一个必成立,若zk≠xm则有Z∈LCS(Xm-1 , Y),类似的,若zk≠yn 则有Z∈LCS(X , Yn-1)。此时,问题化归成求Xm-1与Y的LCS及X与Yn-1的LCS。LCS(X , Y)的长度为:max{LCS(Xm-1 , Y)的长度, LCS(X , Yn-1)的长度}。

           (注释:

             举个例子

             X=m z j a w x u

             Y=x m j y a u z

             因为X7!=Y7所以X,Y两个字符串的最大公共序列应该在

           X=m z j a w x u                            X‘=m z j a w x

           Y’=x,m,j,y,a,u                    或        Y=x m j y a u Z 中产生,即求LCS(Xm,Ym-1)和LCS(Xm-1,ym)中产生)

     

    由于上述当xm≠yn的情况中,求LCS(Xm-1 , Y)的长度与LCS(X , Yn-1)的长度,这两个问题不是相互独立的:两者都需要求LCS(Xm-1,Yn-1)的长度。另外两个序列的LCS中包含了两个序列的前缀的LCS,故问题具有最优子结构性质考虑用动态规划法。

     

    也就是说,解决这个LCS问题,你要求三个方面的东西:1、LCS(Xm-1,Yn-1)+1;2、LCS(Xm-1,Y),LCS(X,Yn-1);3、max{LCS(Xm-1,Y),LCS(X,Yn-1)}

    最长公共子序列的结构有如下表示:

    设序列X=<x1, x2, …, xm>和Y=<y1, y2, …, yn>的一个最长公共子序列Z=<z1, z2, …, zk>,则:

    1. 若xm=yn,则zk=xm=yn且Zk-1是Xm-1和Yn-1的最长公共子序列;
    2. 若xm≠yn且zk≠xm ,则Z是Xm-1和Y的最长公共子序列;
    3. 若xm≠yn且zk≠yn ,则Z是X和Yn-1的最长公共子序列。

    其中Xm-1=<x1, x2, …, xm-1>,Yn-1=<y1, y2, …, yn-1>,Zk-1=<z1, z2, …, zk-1>。

      上面的二维数组,黑色箭头代表找到了一个相同公共元素,这个元素应该在公共子序列中,这个元素和前面元素的最长子序列的并集,组成整个最长的子序列。每个元素的值表示每个字符串之间的最长公共子序列的长度,假设当前元素的位置(Xi,Yj,如果横坐标和纵坐标的字符相等,那么它的值等于(Xi-1,Yj-1)+1,如果横坐标和纵坐标的字符不相等,那么它的值等于max((Xi-1,Yj),(Xi,Yj-1)),这个二维数组完全映射了上面的那个递推公式。把所有子字符串的匹配的可能全部展示出来,从XY的字符串的最开始,递归后面的字符串。最后得到这个二维数组,数字最大的就是最长子序列的长度。

    #include <stdio.h>

      2
      3 int data[8][8]={0};                 //初始化为全是0
      4 char *s1="mzjawxu";
      5 char *s2="xmjyauz";
      6 void print(int i,int j);
      7 int main(){
      8    int i=1,j=1;
      9    for(i=1;i<8;i++){
     10      for(j=1;j<8;j++){
     11         if(*(s1+i-1)==*(s2+j-1)){     //如果两个元素相同,那么这个元素的值等于对角的元素的值加一
     12            data[i][j]=data[i-1][j-1]+1;
     13         }else{                        //如果两个元素不同,取左侧元素和上方元素的最大值,这个值也就是Xi-1,Yj和Xi,Yj-1公共字串的最大长度
     14            data[i][j]=data[i][j-1]>data[i-1][j]?data[i][j-1]:data[i-1][j];
     15         }
     16
     17      }
     18    }
     19    print(i,j);
     20 }
     21
                                //递归打印最大公共子序列
     22 void print(int i,int j){
     23   if(i==0||j==0)
     24       return;
     25   if(*(s1+i-1)==*(s2+j-1)){
     26     print(i-1,j-1);
     27     printf("%c",*(s1+i-1));
     28   }else if(data[i][j-1]>data[i-1][j]){
     29     print(i,j-1);
     30   }else{
     31     print(i-1,j);
     32   }
     33 }

     

  • 相关阅读:
    python+selenium+Chrome options参数
    selenium用法
    python-pytest学习(十九)-pytest分布式执行(pytest-xdist)
    python-pytest学习(十八)-运行上次失败用例(--lf和--ff)
    python-pytest学习(十七)-conftest.py作用范围
    python-pytest学习(十六)-fixture作用范围
    python-pytest学习(十六)-多个fixture和fixture直接相互调用
    python-pytest学习(十五)-fixture详解
    python-pytest学习(十四)配置文件pytest.ini
    python-pytest学习(十三)-fixture之autouse=True
  • 原文地址:https://www.cnblogs.com/wangccc/p/5310605.html
Copyright © 2020-2023  润新知