• 算法 *-* 动态规划


    “动态规划”的出现形式

    动态规划问题的一般形式就是求最值。动态规划其实是运筹学的一种最优化方法,只不过在计算机问题上应用比较多,比如说让你求最长递增子序列呀,最小编辑距离呀等等。

    既然是要求最值,核心问题是什么呢?求解动态规划的核心问题是穷举。因为要求最值,肯定要把所有可行的答案穷举出来,然后在其中找最值呗。

    “动态规划”的三要素

    1. 这类问题存在「重叠子问题」,如果暴力穷举的话效率会极其低下,所以需要「备忘录」或者「DP table」来优化穷举过程,避免不必要的计算。
    2. 动态规划问题一定会具备「最优子结构」,才能通过子问题的最值得到原问题的最值。
    3. 穷举所有可行解其实并不是一件容易的事,只有列出正确的「状态转移方程才能正确地穷举。

    状态转移方程”的模板 (必读)

    ***模板公式***

    明确「状态」 -> 定义 dp 数组/函数的含义 -> 明确「选择」-> 明确 base case  

    来一份详细的例子来解释「状态」「选择」。就讨论最常说的 0-1 背包问题吧:

    给你一个可装载重量为W的背包和N个物品,每个物品有重量和价值两个属性。其中第i个物品的重量为wt[i],价值为val[i],现在让你用这个背包装物品,最多能装的价值是多少?举个简单的例子,输入如下:

    N = 3, W = 4
    wt = [2, 1, 3]
    val = [4, 2, 3]
    

      

    算法返回 6,选择前两件物品装进背包,总重量 3 小于W,可以获得最大价值 6。

    题目就是这么简单,一个典型的动态规划问题。这个题目中的物品不可以分割,要么装进包里,要么不装,不能说切成两块装一半。这也许就是 0-1 背包这个名词的来历。解决这个问题没有什么排序之类巧妙的方法,只能穷举所有可能,根据我们 动态规划套路详解 中的套路,直接走流程就行了。

    第一步要明确两点,「状态」和「选择」

    先说状态,如何才能描述一个问题局面?只要给定几个可选物品和一个背包的容量限制,就形成了一个背包问题,对不对?所以状态有两个,就是「背包的容量」和「可选择的物品」

    再说选择,也很容易想到啊,对于每件物品,你能选择什么?选择就是「装进背包」或者「不装进背包」嘛

    明白了状态和选择,动态规划问题基本上就解决了,只要往这个框架套就完事儿了:PS:此框架出自历史文章 团灭 LeetCode 股票买卖问题

    for 状态1 in 状态1的所有取值:
        for 状态2 in 状态2的所有取值:
            for ...
                dp[状态1][状态2][...] = 择优(选择1,选择2...)
    

     

     

    「状态」易错点 【必看!!!】

    「状态」只选择有限制的,无限制的东西不要当作「状态」,否则会复杂化,运行超时

    例1:零钱兑换 322. Coin Change,该题目的每一种的coin数量是无限的。

    • 如果把「coin数组」和「amount」都看作状态,那么dp[i][j]数组定义是:前 i 个coins去组成 amount = j 时,所需coin最小个数。也能解出来,但是复杂,且超时。
    • 由于每一种coin是无限的,所以最优解是只把「amount」看作状态,那么dp[i]数组定义是: 为了组成amount = i ,所需所需coin最小个数。coin的情况在逻辑中直接遍历即可。
    int coinChange(vector<int>& coins, int amount) {
        // 数组大小为 amount + 1,初始值也为 amount + 1。【重要】这里必须初始化为一个不可能的正数,因为后续会求min值。如果都初始化为0,会出现错误,会和amount=0时的0混淆,影响后续判断。
        vector<int> dp(amount + 1, amount + 1);
        // base case
        dp[0] = 0;//【重要】只有amount = 0的初始值为0
        // 外层 for 循环在遍历所有状态的所有取值
        for (int i = 0; i < dp.size(); i++) {
            // 【重要】coin的情况在这里遍历。内层 for 循环在求所有选择的最小值
            for (int coin : coins) {
                // 子问题无解,跳过
                if (i - coin < 0) continue;
                dp[i] = min(dp[i], 1 + dp[i - coin]);
            }
        }
        return (dp[amount] == amount + 1) ? -1 : dp[amount];//【重要】如果最终结果为之前赋的不可能的正值,还需转化为-1
    }
    

      

    第二步要明确dp数组的定义

    dp数组是什么?其实就是描述问题局面的一个数组。换句话说,我们刚才明确问题有什么「状态」,现在需要用dp数组把状态表示出来。

    首先看看刚才找到的「状态」,有两个,也就是说我们需要一个二维dp数组,一维表示可选择的物品,一维表示背包的容量。

    dp[i][w]的定义如下:对于前i个物品,当前背包的容量为w,这种情况下可以装的最大价值是dp[i][w]

    比如说,如果 dp[3][5] = 6,其含义为:对于给定的一系列物品中,若只对前 3 个物品进行选择,当背包容量为 5 时,最多可以装下的价值为 6。

    PS:为什么要这么定义?便于状态转移,或者说这就是套路,记下来就行了。建议看一下我们的动态规划系列文章,几种动规套路都被扒得清清楚楚了。

    根据这个定义,我们想求的最终答案就是dp[N][W]。base case 就是dp[0][..] = dp[..][0] = 0,因为没有物品或者背包没有空间的时候,能装的最大价值就是 0。

    细化上面的框架:

    int dp[N+1][W+1]
    dp[0][..] = 0
    dp[..][0] = 0
    
    for i in [1..N]:
        for w in [1..W]:
            dp[i][w] = max(
                把物品 i 装进背包,
                不把物品 i 装进背包
            )
    return dp[N][W]
    

      

    第三步,根据「选择」,思考状态转移的逻辑

    简单说就是,上面伪码中「把物品i装进背包」和「不把物品i装进背包」怎么用代码体现出来呢?

    这一步要结合对dp数组的定义和我们的算法逻辑来分析:

    先重申一下刚才我们的dp数组的定义:

    dp[i][w]表示:对于前i个物品,当前背包的容量为w时,这种情况下可以装下的最大价值是dp[i][w]

    如果你没有把这第i个物品装入背包,那么很显然,最大价值dp[i][w]应该等于dp[i-1][w]。你不装嘛,那就继承之前的结果。

    如果你把这第i个物品装入了背包,那么dp[i][w]应该等于dp[i-1][w-wt[i-1]] + val[i-1]

    首先,由于i是从 1 开始的,所以对valwt的取值是i-1

    dp[i-1][w-wt[i-1]]也很好理解:你如果想装第i个物品,你怎么计算这时候的最大价值?换句话说,在装第i个物品的前提下,背包能装的最大价值是多少?

    显然,你应该寻求剩余重量w-wt[i-1]限制下能装的最大价值,加上第i个物品的价值val[i-1],这就是装第i个物品的前提下,背包可以装的最大价值。

    综上就是两种选择,我们都已经分析完毕,也就是写出来了状态转移方程,可以进一步细化代码:

    for i in [1..N]:
        for w in [1..W]:
            dp[i][w] = max(
                dp[i-1][w],
                dp[i-1][w - wt[i-1]] + val[i-1]
            )
    return dp[N][W]
    

      

    最后一步,把伪码翻译成代码,处理一些边界情况

    我用 C++ 写的代码,把上面的思路完全翻译了一遍,并且处理了w - wt[i-1]可能小于 0 导致数组索引越界的问题:

    int knapsack(int W, int N, vector<int>& wt, vector<int>& val) {
        // vector 全填入 0,base case 已初始化
        vector<vector<int>> dp(N + 1, vector<int>(W + 1, 0));
        for (int i = 1; i <= N; i++) {
            for (int w = 1; w <= W; w++) {
                if (w - wt[i-1] < 0) {
                    // 当前背包容量装不下,只能选择不装入背包
                    dp[i][w] = dp[i - 1][w];
                } else {
                    // 装入或者不装入背包,择优
                    dp[i][w] = max(dp[i - 1][w - wt[i-1]] + val[i-1], 
                                   dp[i - 1][w]);
                }
            }
        }
    
        return dp[N][W];
    }
    

      

    现在你看这个解法代码,是不是感觉非常简单,就是把我们刚才分析的思路原封不动翻译了一下而已。

    所以说,明确了动态规划的套路,思路就显得行云流水,非常自然就出答案了。

    至此,背包问题就解决了。相比而言,我觉得这是比较简单的动态规划问题,因为状态转移的推导逻辑比较容易想到,基本上你明确了dp数组的定义,就可以理所当然地确定状态转移了。

    参考文章

    作者:labuladong

    文章:动态规划详解(修订版)经典动态规划:0-1 背包问题

  • 相关阅读:
    innerHTML和innerText
    Function 构造器及其对象、方法
    构造函数
    jquery 获取及设置input各种类型的值
    在浏览器中输入URL并回车后都发生了什么?
    :after和:before的作用及使用方法
    使用JS监听键盘按下事件(keydown event)
    Javascript模块化编程(三):require.js的用法
    Javascript模块化编程(二):AMD规范
    Javascript模块化编程(一):模块的写法
  • 原文地址:https://www.cnblogs.com/frankcui/p/11674594.html
Copyright © 2020-2023  润新知