算法导论读书笔记（17）

动态规划概述

和分治法一样， 动态规划 （dynamic programming）是通过组合子问题的解而解决整个问题的。分治法是将问题划分成一些独立的子问题，递归地求解各子问题，然后合并子问题的解而得到原问题的解。与此不同，动态规划适用于子问题并不独立的情况，即各子问题包含公共的子子问题。在这种情况下，分治法会重复地求解公共的子子问题。而动态规划算法对每个子问题只求解一次，将其结果保存在一张表中，从而避免重复。

动态规划通常用于 最优化问题 。此类问题可能有多种可行解。每个解有一个值，而我们希望找出具有最优（最大或最小）值的解。称这样的解为该问题的“一个”最优解（而不是“确定的”最优解），因而可能存在多个最优解。

动态规划算法的设计可以分为如下4个步骤：

描述最优解的结构
递归定义最优解的值
按自底向上的方式计算最优解的值
由计算出的结构构造一个最优解

钢条切割

钢条切割问题是动态规划问题的一个例子。塞林企业会买进长钢条，将它们切割成短条后卖出（切割是免费的，不计成本）。塞林企业的老总想要知道钢条怎么切割最赚钱。

已知塞林企业对长度为 i 英寸的钢条的售价为 p_i 美元，其中 i = 1，2，…。下图给出了一张样本价格表。

钢条切割问题 的描述如下。给定一根长为 n 的钢条以及价格表 p_i ，其中 i = 1，2，…， n ，找出钢条切割并卖出后可取得的最大收益 r_n 。

考虑一下 n = 4的情况。下图列出了切割4英寸钢条的所有方式。根据样本价格表，最后可知将4英寸钢条切割成2根2英寸钢条的收益最大。 p₂ + p₂ = 10。

一根长度为 n 的钢条共有 2ⁿ^-1 种不同的切割方式。我们这里用普通加法符号表示一个分解，比如7 = 2 + 2 + 3就表示一根长度为7的钢条被切成3份，2根长度为2，一根长度为3。如果最优解将钢条切割成 k 份（ 1 <= k <= n ），那么最优分解即为 n = i₁ + i₂ + … + i_k ，每段钢条的长度为 i₁ ， i₂ ，…， i_k ，对应的最大收益为 r_n = p_i₁ + p_i₂ + … + p_i_k 。

一般来说，我们可以将最优收益 r_n 表示成如下形式：

r_n = max ( p_n , r₁ + r_n_-1 , r₂ + r_n_-2 ,…, r_n_-1 + r₁ )

第一个参数 p_n 代表不切割时钢条的价格。其它的 n - 1个参数首先将钢条分为2份，长度分别为 i 和 n - i （ i = 1，2，…， n - 1），然后分别取得两份的最优收益 r_i 和 r_n_-i 之后做和。因为我们不知道 i 取值为多少时会得到最优解，所以我们必须计算所有可能情况并从中选出最优解。

可以看到，为了解决规模为 n 的初始问题，我们首先要解决的是规模小一些的同类型问题。一旦我们做出了一个划分，我们就可以将划分出的两部分视为钢条切割问题的独立的实例。整体最优解就包含在这相关的两部分子问题之中。我们说钢条切割问题满足 最优子结构 的性质：某问题的最优解由相关子问题的最优解组合而成，且这些子问题可以独立求解。

下面以一种简单的方式安排钢条切割的递归结构，我们能看到一个分解是由位于左侧长度为 i 的一份，以及位于右侧的剩余部分 n - i 。只有右侧的部分可能再次被分解。这样可以得到一个更简洁的公式：

在上面的公式中，最优解只和一个相关的子问题有关（划分后右侧的剩余部分）。

自顶向下的递归实现

下面的过程是一种很直接的，自顶向下，递归风格的实现。

CUT-ROD(p, n)
1 if n == 0
2     return 0
3 q = -∞
4 for i = 1 to n
5     q = max(q, p[i] + CUT-ROD(p, n - i))
6 return q

过程 CUT-ROD 接受一个价格的数组 p [ 1 .. n ]和一个整数 n 作为参数，返回可能的最优解。如果你用自己最熟悉的语言实现了这个 CUT-ROD 过程并运行它，你会发现即使对于不太大的 n 值，你的程序也会花很长的时间才能得出结果。实际上，每次你将 n 值增加1，你的程序的运行时间大约要翻一番。

过程 CUT-ROD 的效率如此低下的原因就是它不断的重复解决相同的子问题。下图给出了一个很好的说明，其中 n = 4，可以看到，过程多次重复计算 n = 2和 n = 1。

为了分析 CUT-ROD 的运行时间，设 T ( n )为问题规模为 n 时调用 CUT-ROD 的总次数，该表达式等于根结点标记为 n 的递归树中的总结点数。该总数包含根结点上的初始调用。因此， T ( 0 ) = 1和

其中 j = n - i ，可得 T ( n ) = 2ⁿ ，因此 CUT-ROD 的运行时间是 n 的幂。

使用动态规划解决钢条切割问题

可以看到，递归算法之所以效率低下，是因为它反复求解相同的子问题。，因此，动态规划会仔细安排求解顺序，对每个子问题只求解一次，并将结果保存下来以便之后查找。由此可见，动态规划需要额外的内存空间来节省计算时间，是典型的 时空权衡 （time-memory trade-off）的例子。

动态规划有两种等价的实现方法。

带备忘的自顶向下法（top-down with memoization）: 此方法仍按自然的递归形式编写过程，但过程会保存每个子问题的解。
自底向上法（bottom-up method）: 这种方法一般需要恰当定义子问题“规模”的概念，使得任何子问题的求解都只依赖于“更小”子问题的求解。因而我们可以将子问题按规模排序，由小到大一次求解。当求解某子问题时，它所依赖的那些更小子问题都已求解完毕，因此每个子问题只求解一次。

两种方法得到的算法具有相同的渐进运行时间，但自底向上方法的时间函数通常具有更小的系数。

下面给出的是自顶向下 CUT-ROD 过程的伪码，加入了备忘机制：

MEMOIZED-CUT-ROD(p, n)
1 let r[0..n] be a new array
2 for i = 0 to n
3     r[i] = -∞
4 return MEMOIZED-CUT-ROD-AUX(p, n, r)

MEMOIZED-CUT-ROD-AUX(p, n, r)
1  if r[n] >= 0
2      reutrn r[n]
3  if n == 0
4      q = 0
5  else
6      q = -∞
7      for i = 1 to n
8          q = max(q, p[i] + MEMOIZED-CUT-ROD-AUX(p, n - i, r))
9  r[n] = q
10 return q

过程 MEMOIZED-CUT-ROD 首先检查值是否已知，如果是，则返回；否则在第6～8行计算值 q ，第9行将 q 存入 r [ n ]，最后返回 q 。

自底向上版本更简单：

BOTTOM-UP-CUT-ROD(p, n)
1 let r[0..n] be a new array
2 r[0] = 0
3 for j = 1 to n
4     q = -∞
5     for i = 1 to j
6         q = max(q, p[i] + r[j - i])
7     r[j] = q
8 return r[n]

过程 BOTTOM-UP-CUT-ROD 采用子问题的自然顺序：若 i < j ，则规模为 i 的子问题比规模为 j 的子问题“更小”。因此，过程依次求解规模为 j = 0，1，…， n 的子问题。

子问题图

当思考一个动态规划为问题时，我们应该了解问题的子问题之间的依赖关系。

问题的 子问题图 准确地表达了这些信息，子问题图是一个有向图，每个定点唯一地对应一个子问题。如果求子问题 x 的最优解时需要直接用到子问题 y 的最优解，那么在子问题图中就会有一条从子问题 x 到子问题 y 的有向边。下图显示了 n = 4时钢条切割问题的子问题图。

子问题图 G = ( V , E )的规模可以帮助我们确定动态规划的运行时间。由于每个子问题只求解一次，因此算法运行时间等于每个子问题求解时间之和。通常，一个子问题的求解时间与子问题图中对应顶点的度成正比，而子问题的数目等于子问题的顶点数。因此，通常情况下，动态规划算法的运行时间与顶点和边的数量呈线性关系。

重构解

上面的算法仅返回最优解的收益值，并未返回解本身。这里可以扩展该算法。

EXTENDED-BOTTOM-UP-CUT-ROD(p, n)
1  let r[0..n] and s[0..n] be new arrays
2  r[0] = 0
3  for j = 1 to n
4      q = -∞
5      for i = 1 to j
6          if q < p[i] + r[j - i]
7              q = p[i] + r[j - i]
8              s[j] = i
9      r[j] = q
10 return r and s

钢条切割问题的简单Java实现

/**
 * 带备忘的自顶向下方法
 *
 * @param price 价格表
 * @param n     待分割的长度
 */
public static int memoizedCutRod(int[] price, int n) {
    int[] revenue = new int[n + 1];
    for (int i = 0; i < revenue.length; i++)    // 初始化revenue数组
        revenue[i] = Integer.MIN_VALUE;
    return memoizedCutRodAux(price, n, revenue);
}

private static int memoizedCutRodAux(int[] price, int n, int[] revenue) {
    int q;
    if (revenue[n] >= 0)    // 如果revenue数组中有记录，就返回数组中的结果
        return revenue[n];
    if (n == 0)
        q = 0;
    else {
        q = Integer.MIN_VALUE;
        for (int i = 1; i <= n; i++)
            q = Integer.max(q, price[i] + memoizedCutRodAux(price, n - i, revenue));
        revenue[n] = q;
    }
    return q;
}

/**
 * 自底向上法
 *
 * @param price 价格表
 * @param n     待分割的长度
 */
public static int bottomUpCutRod(int[] price, int n) {
    int[] revenue = new int[n + 1];
    int q;
    revenue[0] = 0;
    for (int j = 1; j <= n; j++) {
        q = Integer.MIN_VALUE;
        for (int i = 1; i <= j; i++)
            q = Integer.max(q, price[i] + revenue[j - i]);
        revenue[j] = q;
    }
    return revenue[n];
}

算法导论读书笔记（17）

算法导论读书笔记（17）

目录

动态规划概述

钢条切割

自顶向下的递归实现

使用动态规划解决钢条切割问题

子问题图

重构解

钢条切割问题的简单Java实现