• 最长公共子序列


    一个字符串S,去掉零个或者多个元素所剩下的子串称为S的子序列。最长公共子序列就是寻找两个给定序列的子序列,该子序列在两个序列中以相同的顺序出现,但是不必要是连续的。

    例如序列X=ABCBDAB,Y=BDCABA。序列BCA是X和Y的一个公共子序列,但是不是X和Y的最长公共子序列,子序列BCBA是X和Y的一个LCS,序列BDAB也是。

    寻找LCS的一种方法是枚举X所有的子序列,然后注意检查是否是Y的子序列,并随时记录发现的最长子序列。假设X有m个元素,则X有2^m个子序列,指数级的时间,对长序列不实际。

    使用动态规划求解这个问题,先寻找最优子结构。设X=<x1,x2,…,xm>和Y=<y1,y2,…,yn>为两个序列,LCS(X,Y)表示X和Y的一个最长公共子序列,可以看出

    如果xm=yn,则LCS ( X,Y ) = xm + LCS ( Xm-1,Yn-1 )。
    如果xm!=yn,则LCS( X,Y )= max{ LCS ( Xm-1, Y ), LCS ( X, Yn-1 ) }
    LCS问题也具有重叠子问题性质:为找出X和Y的一个LCS,可能需要找X和Yn-1的一个LCS以及Xm-1和Y的一个LCS。但这两个子问题都包含着找Xm-1和Yn-1的一个LCS,等等.

    DP最终处理的还是数值(极值做最优解),找到了最优值,就找到了最优方案;为了找到最长的LCS,我们定义dp[i][j]记录序列LCS的长度,合法状态的初始值为当序列X的长度为0或Y的长度为0,公共子序列LCS长度为0,即dp[i][j]=0,所以用i和j分别表示序列X的长度和序列Y的长度,状态转移方程为

    dp[i][j] = 0  如果i=0或j=0
    dp[i][j] = dp[i-1][j-1] + 1  如果X[i-1] = Y[i-1]
    dp[i][j] = max{ dp[i-1][j], dp[i][j-1] }  如果X[i-1] != Y[i-1]

    求出了最长公共子序列的长度后,输出LCS就是输出dp的最优方案了,既可以用一个额外的矩阵存储路径,也可以直接根据状态转移矩阵倒推最优方案。

    #include <stdio.h>
    #include <string.h>
    #define MAXLEN 100
    
    void LCSLength(char *x, char *y, int m, int n, int c[][MAXLEN], int b[][MAXLEN])
    {
        int i, j;
        
        for(i = 0; i <= m; i++)
            c[i][0] = 0;
        for(j = 1; j <= n; j++)
            c[0][j] = 0;
        for(i = 1; i<= m; i++){
            for(j = 1; j <= n; j++){
    
                if(x[i-1] == y[j-1]){
                    c[i][j] = c[i-1][j-1] + 1;
                    b[i][j] = 0;
                }else if(c[i-1][j] >= c[i][j-1]){
                    c[i][j] = c[i-1][j];
                    b[i][j] = 1;
                }else{
                    c[i][j] = c[i][j-1];
                    b[i][j] = -1;
                }
            }
        }
    }
    
    void PrintLCS(int b[][MAXLEN], char *x, int i, int j)
    {
        if(i == 0 || j == 0)
            return;
        if(b[i][j] == 0)
        {
            PrintLCS(b, x, i-1, j-1);
            printf("%c ", x[i-1]);
        }
        else if(b[i][j] == 1)
            PrintLCS(b, x, i-1, j);
        else
            PrintLCS(b, x, i, j-1);
    }
    
    int main(int argc, char **argv)
    {
        char x[MAXLEN] = {"ABCBDAB"};
        char y[MAXLEN] = {"BDCABA"};
        int b[MAXLEN][MAXLEN];
        int c[MAXLEN][MAXLEN];
        int m, n;
        
        m = strlen(x);
        n = strlen(y);
        
        LCSLength(x, y, m, n, c, b);
        PrintLCS(b, x, m, n);
        
        return 0;
    }

    如果不需要输出序列,则可以使用滚动数组的方式

    #include <iostream>
    using namespace std;
     
    //滚动数组 
     
    int dp[2][21];  //存储LCS长度 
    char X[21];
    char Y[21];
    int i, j, k;
     
    void main()
    {
        cin.getline(X,20);
        cin.getline(Y,20);
     
        int xlen = strlen(X);
        int ylen = strlen(Y);
     
        for(i = 1; i <= xlen; ++i)
        {
            k = i & 1;
            for(j = 1; j <= ylen; ++j)
            {
                if(X[i-1] == Y[j-1])
                {
                    dp[k][j] = dp[k^1][j-1] + 1;
                }else if(dp[k][j-1] > dp[k^1][j])
                {
                    dp[k][j] = dp[k][j-1];
                }else
                {
                    dp[k][j] = dp[k^1][j];
                }
            }
        }
        printf("len of LCS is: %d
    ", dp[k][ylen]);
    }


  • 相关阅读:
    java异常
    Swfmill概述
    AS3中e4x用法纲要
    抽象工厂模式(Abstract Factory)
    动态绑定、抽象类、接口
    Form中Trigger的执行顺序
    Form 中FND_Message的用法总结
    Form属性、内置子程序、触发器、系统变量
    Oracle EBS R12 XML数据表格的Excel脚本报表 PLUS :问题杂烩
    Oralce EBS Alert
  • 原文地址:https://www.cnblogs.com/sjw1357/p/3863991.html
Copyright © 2020-2023  润新知