• 编程之美学习之最长子序列的解法


      实在愚钝,虽然是以前看过的算法,今天也是折腾了一天才稍微弄懂了一些。特此记下笔记

      第一次遇到这个问题的场景是猴子摘桃问题,原题如下:

      小猴子下山,沿着下山的路有一排桃树,每棵树都结了一些桃子。小猴子想摘桃子,但是有一些条件需要遵守,小猴子只能沿着下山的方向走,
    不能回头,每颗树最多摘一个,而且一旦摘了一棵树的桃子,就不能再摘比这棵树结的桃子少的树上的桃子。那么小猴子最多能摘到几颗桃子呢?
    举例说明,比如有5棵树,分别结了10,4,5,12,8颗桃子,那么小猴子最多能摘3颗桃子,来自于结了4,5,8颗桃子的桃树

      首先讲第一种解法:

      要明白这题最关键的一步就是要清楚,不要直接拿数组中的元素一个个去比较,只需要知道,前 i 个元素中最长的递增子序列(LIS)的长度,或者,以第 i 个元素结尾的LIS的长度 ,第1个元素结尾的LIS的只有他自己一个,所以result[0] = 1,以第2个元素结尾的LIS则之需要和第1个元素peach[0]比较即可,若大于第1个元素,则在result[0]++ 就是他的LIS ,若小于,则同样result[1]=1 , 很明显,第i个元素结尾的LIS起码都是1。。  以后的任意i值,都可以依次类推获得到结果。 以下是该方法的算法代码:

    /*小猴子下山,沿着下山的路有一排桃树,每棵树都结了一些桃子。小猴子想摘桃子,但是有一些条件需要遵守,小猴子只能沿着下山的方向走,
        不能回头,每颗树最多摘一个,而且一旦摘了一棵树的桃子,就不能再摘比这棵树结的桃子少的树上的桃子。那么小猴子最多能摘到几颗桃子呢?
        举例说明,比如有5棵树,分别结了10,4,5,12,8颗桃子,那么小猴子最多能摘3颗桃子,来自于结了4,5,8颗桃子的桃树。*/
        int peaches[] = new int[]{4,4,5,2,3,156,15,6156,156,165,15,6};
        @Test
        public void test222(){
            /*Scanner in = new Scanner(System.in );
            System.out.print("请输入数的颗树:");
            int trees = Integer.parseInt(in.nextLine().trim());
            peaches = new int[trees];
            for (int i = 0; i < peaches.length; i++) {
                peaches[i] = Integer.parseInt(in.nextLine().trim());
            }*/
            printArray(peaches);
            System.out.println(pick(peaches));
            System.out.println(findMax2(peaches));
    
        }
    
    /*    5
        2
        3
        156
        15
        6156
        156
        165
        15
        6*/
        // 思路:求出以位置所有 以 peach[i](存入result[i]中)结尾的最长递增子序列的长度--->根据每个 result[0~j],
        // 拿peach[i]和peach[j]比较,如果peach[i]>peach[j],且result[j]+1>result[i],很明显,就该把result[i]值加1
        // 所以,这种方法起码能找出一个最长序列,有时候可以找出多条,但有个条件,结尾的peach[i] 一定不相同
        int pick(int[] peaches) {
            int max = 1;
            int length = peaches.length;
            // sequences存储桃树peach[i]每个位置,最长序列的每个元素。
            List<ArrayList<Integer>> sequences = new ArrayList<ArrayList<Integer>>();
            
            // 记录每个位置的最长递增子序列的长度
            int result[] = new int[length];
            for (int i = 0; i < length; i++) {
                result[i] = 1;
                ArrayList<Integer> list= new ArrayList<Integer>();
                // 相当于每个位置初始化设置result[i]=1并且把自己放进去  ---->为了存好没进入循环的以及进入循环没进入关键判断的元素
                list.add(peaches[i]);
                for (int j = 0; j < i; j++) {
                    //必須新new一個,每一次循环,都是一次新的比较和 , 即和result[0 ~ i-1]的比较
                    // 不能是clear,因为这个newL是被引用的,所以,不能修改原对象的值
                    ArrayList<Integer> newL = new ArrayList<Integer>();
                    //这里也要初始化一次 ----> 为了进入判断后失去了本身元素,导致后面连锁的错误
                    newL.add(peaches[i]);
                    //关键判断: 如果是i位置大于j位置,且j位置的最长递增子序列的长度+1长于目前i位置的最长递增子序列的长度,则更新i位置的最长递增子序列
                    if (peaches[j] <= peaches[i] && result[j] + 1 > result[i]){
                        result[i] = result[j] + 1;
                        //j为此时比较的位置上最大的序列集合存储的索引
                        newL.addAll(sequences.get(j));
                        list = newL;
                    }
                }
                sequences.add(list);
                System.out.println(sequences);
            }
            for (int i : result)
                max = i > max ? i : max;
                
            System.out.println(sequences);
            System.out.println(Arrays.toString(result));
           /* for(ArrayList<Integer> l : sequences){
                // 
                if(l.size() >= max){
                    System.out.println(l);
                }
            }   */
             
            return max;
        }
        /*
         * 第二种方法的思路很简单,即开辟一段新的空间存储相应长度LCS中的最大元素的最小元素,举个例子:1,2,5,4 ...  当扫描到5(i=2)的时候,maxV[3] = 5 , result[2] = 3 
         * ,maxV[3] 即指的是 长度为3的LCS中最大元素的最小元素,所以当扫描到3的时候,maxV[3]就更新为4了 , 因为 5>4 ,且他们的result的长度都为3 这样子,就可以直接比较当前的peach[i]和
         * nMaxResult就可以算出当前i的result
         */
        // 方法二
        private int findMax2(int [] peaches){
            int [] maxV = new int[peaches.length];
            maxV[1] = peaches[0];
            maxV[0] = -1;
            int [] result = new int[peaches.length];
            for(int i=0 ; i<result.length ; i++){
                result[i] = 1;
            }
            // 最长子序列变量
            int nMaxResult = 1;
            for(int i=1 ; i<peaches.length ; i++){
                int j;
                //只要中一个小于peaches[i],更新i的最长子序列的长度,退出遍历
                //这里可以换成二分查找
                 for(j = nMaxResult ; j>=1 ; j--){
                //for(j = result[i-1] ; j>=1 ; j--){
                    if(peaches[i] >= maxV[j] && result[i]<(j+1)){
                        result[i] = j+1;
                        break;
                    }
                }
                if(result[i] > nMaxResult){
                    nMaxResult = result[i];
                    maxV[result[i]] = peaches[i];
                }else if( maxV[j]<peaches[i] 
                        &&peaches[i]<maxV[j+1] ){
                    // 持续更新LCS中最大元素的最小元素 , 保证后面的比较是正确的
                    // 比如 8 9 1 2 3 走完前两步后maxV[1] = 8 , maxV[2] = 9 再走完两部后maxV[1]=1 maxV[2]=2,
                    // 这样就保证了当扫描第3的时候能够匹配成功,这就能够是LIS尽可能长了。
                    maxV[result[i]] = peaches[i];
                }
            }
            System.out.println(Arrays.toString(result));
            return nMaxResult;
        }

      

      以上多了我自己添加了打印序列的代码,同学们也可以自己屏蔽掉(想看的话,是从后往前看哦,我懒得改了)。同时我也偷了个懒,顺便把第二种发放贴了上去了。在这里继续介绍下去...

      第二种方法的思路很简单,即开辟一段新的空间存储相应长度LCS中的最大元素的最小元素,举个例子:1,2,5,4 ...  当扫描到5(i=2)的时候,maxV[3] = 5 , LIS[2] = 3 ,maxV[3] 即指的是 长度为3的LCS中最大元素的最小元素,所以当扫描到3的时候,maxV[3]就更新为4了 , 因为 5>4 ,且他们的LIS的长度都为3

      这样子,就可以直接比较当前的peach[i]和nMaxLIS就可以算出当前i的LIS

      这样做是有原因的! 其实现在这么做的话,效率还是n2 , 其实还有第三种代码,因为maxV中的记录肯定是满足maxV[1] < maxV[2] <maxV[3] ....细心的同学可以已经发现,这种规律可以用二分查找方法取代遍历 这样就可以把效率提高到 nlog2n (二分查找的效率是log2n)。依据单调递增,将上面便利部分,做以下改动

      最后将上面的代码换成二分查找去匹配,效率应该会更有改善,有兴趣的同学可以尝试

      以前纯属个人观点,如有错误还请大佬们海涵,还请大佬们指点

    以下来自知乎,拿最长子序列做例子学习动态规划的。

    作者:徐凯强 Andy
    链接:https://www.zhihu.com/question/23995189/answer/35324479
    来源:知乎
    著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

    动态规划中递推式的求解方法不是动态规划的本质。

    我曾经作为省队成员参加过NOI,保送之后也给学校参加NOIP的同学多次讲过动态规划,我试着讲一下我理解的动态规划,争取深入浅出。希望你看了我的答案,能够喜欢上动态规划。

    0. 动态规划的本质,是对问题状态的定义状态转移方程的定义
    引自维基百科
    dynamic programming is a method for solving a complex problem by breaking it down into a collection of simpler subproblems.

    动态规划是通过拆分问题,定义问题状态和状态之间的关系,使得问题能够以递推(或者说分治)的方式去解决。
    本题下的其他答案,大多都是在说递推的求解方法,但如何拆分问题,才是动态规划的核心。
    拆分问题,靠的就是状态的定义状态转移方程的定义

    1. 什么是状态的定义?

    首先想说大家千万不要被下面的数学式吓到,这里只涉及到了函数相关的知识。

    我们先来看一个动态规划的教学必备题:
    给定一个数列,长度为N,
    求这个数列的最长上升(递增)子数列(LIS)的长度.

    1 7 2 8 3 4
    为例。
    这个数列的最长递增子数列是 1 2 3 4,长度为4;
    次长的长度为3, 包括 1 7 8; 1 2 3 等.

    要解决这个问题,我们首先要定义这个问题和这个问题的子问题。
    有人可能会问了,题目都已经在这了,我们还需定义这个问题吗?需要,原因就是这个问题在字面上看,找不出子问题,而没有子问题,这个题目就没办法解决。

    所以我们来重新定义这个问题:
    给定一个数列,长度为N,
    F_{k}为:以数列中第k项结尾的最长递增子序列的长度.
    F_{1}..F_{N} 中的最大值.

    显然,这个新问题与原问题等价。
    而对于F_{k}来讲,F_{1} .. F_{k-1}都是F_{k}的子问题:因为以第k项结尾的最长递增子序列(下称LIS),包含着以第1..k-1中某项结尾的LIS。

    上述的新问题F_{k}也可以叫做状态,定义中的“F_{k}为数列中第k项结尾的LIS的长度”,就叫做对状态的定义。
    之所以把F_{k}做“状态”而不是“问题” ,一是因为避免跟原问题中“问题”混淆,二是因为这个新问题是数学化定义的。


    对状态的定义只有一种吗?当然不是
    我们甚至可以二维的,以完全不同的视角定义这个问题:
    给定一个数列,长度为N,
    F_{i, k}为:
    在前i项中的,长度为k的最长递增子序列中,最后一位的最小值. 1leq kleq N.
    若在前i项中,不存在长度为k的最长递增子序列,则F_{i, k}为正无穷.
    求最大的x,使得F_{N,x}不为正无穷。

    这个新定义与原问题的等价性也不难证明,请读者体会一下。
    上述的F_{i, k}就是状态,定义中的“F_{i, k}为:在前i项中,长度为k的最长递增子序列中,最后一位的最小值”就是对状态的定义。


    2. 什么是状态转移方程
    上述状态定义好之后,状态和状态之间的关系式,就叫做状态转移方程。

    比如,对于LIS问题,我们的第一种定义:
    F_{k}为:以数列中第k项结尾的最长递增子序列的长度.
    设A为题中数列,状态转移方程为:
    F_{1} = 1 (根据状态定义导出边界情况)
    F_{k}=max(F_{i}+1 | A_{k}>A_{i}, iin (1..k-1)) (k>1)

    用文字解释一下是:
    以第k项结尾的LIS的长度是:保证第i项比第k项小的情况下,以第i项结尾的LIS长度加一的最大值,取遍i的所有值(i小于k)。

    第二种定义:
    F_{i, k}为:在数列前i项中,长度为k的递增子序列中,最后一位的最小值
    设A为题中数列,状态转移方程为:
    A_{i}>F_{i-1,k-1}F_{i,k}=min(A_{i},F_{i-1,k})
    否则:F_{i,k}=F_{i-1,k}

    (边界情况需要分类讨论较多,在此不列出,需要根据状态定义导出边界情况。)
    大家套着定义读一下公式就可以了,应该不难理解,就是有点绕。

    这里可以看出,这里的状态转移方程,就是定义了问题和子问题之间的关系。
    可以看出,状态转移方程就是带有条件的递推式。

    3. 动态规划迷思
    本题下其他用户的回答跟动态规划都有或多或少的联系,我也讲一下与本答案的联系。

    a. “缓存”,“重叠子问题”,“记忆化”:
    这三个名词,都是在阐述递推式求解的技巧。以Fibonacci数列为例,计算第100项的时候,需要计算第99项和98项;在计算第101项的时候,需要第100项和第99项,这时候你还需要重新计算第99项吗?不需要,你只需要在第一次计算的时候把它记下来就可以了。
    上述的需要再次计算的“第99项”,就叫“重叠子问题”。如果没有计算过,就按照递推式计算,如果计算过,直接使用,就像“缓存”一样,这种方法,叫做“记忆化”,这是递推式求解的技巧。这种技巧,通俗的说叫“花费空间来节省时间”。都不是动态规划的本质,不是动态规划的核心。

    b. “递归”:
    递归是递推式求解的方法,连技巧都算不上。

    c. "无后效性",“最优子结构”:
    上述的状态转移方程中,等式右边不会用到下标大于左边i或者k的值,这是"无后效性"的通俗上的数学定义,符合这种定义的状态定义,我们可以说它具有“最优子结构”的性质,在动态规划中我们要做的,就是找到这种“最优子结构”。
    在对状态和状态转移方程的定义过程中,满足“最优子结构”是一个隐含的条件(否则根本定义不出来)。对状态和“最优子结构”的关系的进一步解释,什么是动态规划?动态规划的意义是什么? - 王勐的回答 写的很好,大家可以去读一下。

    需要注意的是,一个问题可能有多种不同的状态定义和状态转移方程定义,存在一个有后效性的定义,不代表该问题不适用动态规划。这也是其他几个答案中出现的逻辑误区:
    动态规划方法要寻找符合“最优子结构“的状态和状态转移方程的定义在找到之后,这个问题就可以以“记忆化地求解递推式”的方法来解决。而寻找到的定义,才是动态规划的本质。

    有位答主说:
    分治在求解每个子问题的时候,都要进行一遍计算
    动态规划则存储了子问题的结果,查表时间为常数

    这就像说多加辣椒的菜就叫川菜,多加酱油的菜就叫鲁菜一样,是存在误解的。

    文艺的说,动态规划是寻找一种对问题的观察角度,让问题能够以递推(或者说分治)的方式去解决。寻找看问题的角度,才是动态规划中最耀眼的宝石!(大雾)
  • 相关阅读:
    寒假第七天
    寒假第六天
    寒假第五天
    寒假第四天
    leetcode 105 从前序与中序遍历序列构造二叉树
    leetcode 268 丢失的数字
    leetcode 141 环形链表
    判断顶点是否在三角形内部
    java 基本数据类型
    leetcode 20 有效的括号
  • 原文地址:https://www.cnblogs.com/liujiaa/p/7757827.html
Copyright © 2020-2023  润新知