经典动态规划:背包问题
本文题为《背包问题九讲》,从属于《动态规划的思考艺术》系列。这系列文章的第一版于 2007 年下半年使用 EmacsMuse 制作,以 HTML 格式发布到网上,转载众多,有一定影响力。2011 年 9 月,本系列文章由原作者用$LATEX$重新制作并全面修订,您现在看到的是2.0 beta 版本,修订历史及最新版本请访问https://github.com/tianyicui/pack查阅。
本文版权归原作者所有,采用 CC BY-NC-SA 协议发布。
本篇为整理与笔记心得(【注解仅代表个人观点】)。
01背包
题目
有$N$件物品和一个容量为$V$的背包。放入第$i$件物品耗费的费用是$C_i$ ,得到的价值是$W_i$。求解将哪些物品装入背包可使价值总和最大。
基本思路
这是最基础的背包问题,特点是:每种物品仅有一件,可以选择放或不放。
用子问题定义状态:即$F[i, v]$表示前$i$件物品恰放入一个容量为$v$的背包可以获得的最大价值。则其状态转移方程便是:
这个方程非常重要,基本上所有跟背包相关的问题的方程都是由它衍生出来的。所以有必要将它详细解释一下:“将前$i$件物品放入容量为$v$的背包中”这个子问题,若只考虑第$i$件物品的策略(放或不放),那么就可以转化为一个只和前$i -1$件物品相关的问题。如果不放第$i$件物品,那么问题就转化为“前$i - 1$件物品放入容量为$v$的背包中”,价值为$F[i − 1, v]$;如果放第$i$件物品,那么问题就转化为“前$i - 1$件物品放入剩下的容量为$v - C_i$的背包中”,此时能获得的最大价值就是$F[i − 1, v − C_i]$再加上通过放入第$i$件物品获得的价值$W_i$。
伪代码
优化空间复杂度
以上方法的时间和空间复杂度均为 $O(VN)$,其中时间复杂度应该已经不能再优化了,但空间复杂度却可以优化到$O(V)$。先考虑上面讲的基本思路如何实现,肯定是有一个主循环$i ← 1dots N$,每次算出来二维数组$F[i, 0dots V]$的所有值。那么,如果只用一个数组$F[0dots V]$ ,能不能保证第$i$次循环结束后$F[v]$中表示的就是我们定义的状态$F[i, v]$呢?$F[i, v]$是由$F[i − 1, v]$和$F[i − 1, v − C_i]$两个子问题递推而来,能否保证在推$F[i, v]$时(也即在第$i$次主循环中推$F[v]$时)能够取用$F[i − 1, v]$和$F[i − 1, v − C_i]$的值呢?事实上,这要求在每次主循环中我们以$v ← Vdots0$的递减顺序计算$F[v]$,这样才能保证计算$F[v]$时$F[v − C_i]$保存的是状态$F[i − 1, v − C_i]$的值。
其中的$F[v] ← max {F[v],F[v − C_i] + W_i}$一句,恰就对应于我们原来的转移方程,因为现在的$F[v − C_i]$ 就相当于原来的$F[i − 1,v − C_i]$ 。如果将$v$的循环顺序从上面的逆序改成顺序的话,那么则成了$F[i, v]$由$F[i,v − C_i]$推导得到,与本题意不符。事实上,使用一维数组解01背包的程序在后面会被多次用到,所以这里抽象出一个处理一件01背包中的物品过程,以后的代码中直接调用不加说明。
有了这个过程以后, 01 背包问题的伪代码就可以这样写:
初始化的细节问题
我们看到的求最优解的背包问题题目中,事实上有两种不太相同的问法。有的题目要求“恰好装满背包”时的最优解,有的题目则并没有要求必须把背包装满。一种区别这两种问法的实现方法是在初始化的时候有所不同。如果是第一种问法,要求恰好装满背包,那么在初始化时除了$F[0]$为$0$,其它$F[1dots V]$均设为$-infty$,这样就可以保证最终得到的$F[V]$是一种恰好装满背包的最优解。如果并没有要求必须把背包装满,而是只希望价格尽量大,初始化时应该将$F[0dots V]$全部设为$0$。这是为什么呢?可以这样理解:初始化的$F$数组事实上就是在没有任何物品可以放入背包时的合法状态。如果要求背包恰好装满,那么此时只有容量为$0$的背包可以在什么也不装且价值为$0$的情况下被“恰好装满”,其它容量的背包均没有合法的解,属于未定义的状态,应该被赋值为$-infty$了。如果背包并非必须被装满,那么任何容量的背包都有一个合法解“什么都不装”,这个解的价值为$0$,所以初始时状态的值也就全部为$0$了。这个小技巧完全可以推广到其它类型的背包问题,后面不再对进行状态转移之前的初始化进行讲解。
【注解:从0开始,即没有物品,对应0价值,那么在“恰好装满”的要求下,对应0物品的初始状态(没有物品可装),只有$F[0] = 0$是合法解(剩余空间为0),其它应该设置为$-infty$(既不可能存在这种情况),然后再从1开始一直到N,进行迭代更新。而在“无需装满”的条件下,对应0物品的初始状态,所有$F[0dots V]$的解都合法,所以都可以初始化为0(所有情况都可能)参与迭代与更新。】
一个常数优化
上面伪代码中的
中第二重循环的下限可以改进。它可以被优化为
这个优化之所以成立的原因请读者自己思考。(提示:使用二维的转移方程思考较易。)
【注解:由于只需要最后$F[v]$的值,倒推前一个物品,其实只要知道$F[v - W_n]$即可。以此类推,对以第j个背包,其实只需要知道到$F[v - sum_i^N W_i]$即可。(没太明白)】
【例题】选电影
问题
解题思路
$c[i]$表示第$i$件物品的代价,$w[i]$表示第$i$件物品的价值。
$ans[x][y]$:前$x$种物品去填充总代价为$y$的空间,所能获得的最大价值。所以$ans[x][y]$有:
1. 买不起:$ans[x][y] = ans[x - 1][y] (y < c[x])$
2. 买得起:买有$ans[x][y] = ans[x - 1][y - c[x]] + w[x]$;不买有$ans[x][y] = ans[x -1][y]$ (这里的买或不买指的是最佳方案中有或没有第$i$件物品)
#include <iostream> using namespace std; int n, m; int c[1005], w[1005], ans[1005][1005]; int main() { cin >> n >> m; for (int i = 1; i <= n; i++) { cin >> c[i] >> w[i]; } for (int i = 1; i <= n; i++) { for (int j = 1; j <= m; j++) { if (j < c[i]) { ans[i][j] = ans[i - 1][j]; } else { ans[i][j] = max(ans[i - 1][j], ans[i -1][j - c[i]] + w[i]); } } } cout<< ans[n][m] << endl; return 0; }
空间优化
当前状态($ans[i]$)只与上一层状态($ans[i - 1])有关,所以二维数组可降为一维。(从后往前遍历是为了防止数据更新带来的覆盖错误)
#include <iostream> #include <stack> using namespace std; int n, m; int c[1005], w[1005], ans[1005]; int main() { cin >> n >> m; for (int i = 1; i <= n; i++) { cin >> c[i] >> w[i]; } for (int i = 1; i <= n; i++) { for (int j = m; j > 0; j--) { if (j >= c[i]) { ans[j] = max(ans[j], ans[j - c[i]] + w[i]); } } } cout<< ans[m] << endl; return 0; }
小结
01 背包问题是最基本的背包问题,它包含了背包问题中设计状态、方程的最基本思想。另外,别的类型的背包问题往往也可以转换成 01 背包问题求解。故一定要仔细体会上面基本思路的得出方法,状态转移方程的意义,以及空间复杂度怎样被优化
完全背包
题目
有$N$种物品和一个容量为$V$的背包,每种物品都有无限件可用。放入第$i$种物品的费用是$C_i$,价值是$W_i$。求解:将哪些物品装入背包,可使这些物品的耗费的费用总和不超过背包容量,且价值总和最大。
基本思路
这个问题非常类似于 01 背包问题,所不同的是每种物品有无限件。也就是从每种物品的角度考虑,与它相关的策略已并非取或不取两种,而是有取 0 件、取 1 件、取 2件……直至取$[V / C_i]$件等许多种。如果仍然按照解 01 背包时的思路,令$F[i, v]$表示前[i]种物品恰放入一个容量为$v$的背包的最大权值。仍然可以按照每种物品不同的策略写出状态转移方程,像这样:
这跟 01 背包问题一样有$O(VN)$个状态需要求解,但求解每个状态的时间已经不是常数了,求解状态$F[i, v]$的时间是$O(frac{v}{C_i})$,总的复杂度可以认为是$O(NVsum frac{v}{C_i})$,是比较大的。将 01 背包问题的基本思路加以改进,得到了这样一个清晰的方法。这说明 01 背包问题的方程的确是很重要,可以推及其它类型的背包问题。但我们还是要试图改进这个复杂度。
【注解:完全背包问题实际上就是01背包问题的扩展,将0或1的选择,变成了0~$V / C_i$的选择,因此一般解法的时间复杂度更大。】
一个简单有效的优化
完全背包问题有一个很简单有效的优化,是这样的:若两件物品$i、j$满足$C_i ≤ C_j$且$W_i ≥ W_j$,则将可以将物品$j$直接去掉,不用考虑。这个优化的正确性是显然的:任何情况下都可将价值小费用高的$j$换成物美价廉的$i$,得到的方案至少不会更差。对于随机生成的数据,这个方法往往会大大减少物品的件数,从而加快速度。然而这个并不能改善最坏情况的复杂度,因为有可能特别设计的数据(指费用越来越小,价值越来越高的测试用例)可以一件物品也去不掉。这个优化可以简单的$O(N^2)$地实现,一般都可以承受。另外,针对背包问题而言,比较不错的一种方法是:首先将费用大于$V$的物品去掉,然后使用类似计数排序的做法,计算出费用相同的物品中价值最高的是哪个,可以$O(V + N)$地完成这个优化。这个不太重要的过程就不给出伪代码了,希望你能独立思考写出伪代码或程序。
【注解:$O(N^2)$应该是指对第$i(0 < i <= N)$个物品,扫描一遍第$1~i - 1$个物品,查找是否有更物美价廉的存在,存在,则跳过第$i$个物品该轮迭代(因为不用考虑);不存在,则按照正常迭代。$O(V + N)$(参考计数排序)应该是指先直接pass费用大于$V$的物品,剩余物品按照费用分好组(费用相同为一组),取每组价值最高的参与迭代(即不是最高的直接跳过)。】
转化为 01 背包问题求解
01 背包问题是最基本的背包问题,我们可以考虑把完全背包问题转化为 01 背包问题来解。最简单的想法是,考虑到第$i$种物品最多选$[V / C_i]$件,于是可以把第$i$种物品转化为$[V / C_i]$件费用及价值均不变的物品,然后求解这个 01 背包问题。这样的做法完全没有改进时间复杂度,但这种方法也指明了将完全背包问题转化为 01 背包问题的思路:将一种物品拆成多件只能选$0$件或$1$件的 01 背包中的物品。更高效的转化方法是:把第$i$种物品拆成费用为$C_i2^k$ 、价值为 $W_i2^k$的若干件物品,其中$k$取遍满足$C_i2^k ≤ V$的非负整数。这是二进制的思想。因为,不管最优策略选几件第$i$种物品,其件数写成二进制后,总可以表示成若干个$2^k$件物品的和。这样一来就把每种物品拆成$O(log⌊V / C_i⌋)$件物品,是一个很大的改进。
O(VN) 的算法
这个算法使用一维数组,先看伪代码:
你会发现,这个伪代码与 01 背包问题的伪代码只有 v 的循环次序不同而已。为什么这个算法就可行呢?首先想想为什么 01 背包中要按照$v$递减的次序来循环。让$v$递减是为了保证第$i$次循环中的状态$F[i, v]$是由状态$F[i − 1, v − C_i]$递推而来。换句话说,这正是为了保证每件物品只选一次,保证在考虑“选入第$i$件物品”这件策略时,依据的是一个绝无已经选入第$i$件物品的子结果$F[i − 1, v − C_i]$。而现在完全背包的特点恰是每种物品可选无限件,所以在考虑“加选一件第$i$种物品”这种策略时,却正需要一个可能已选入第$i$种物品的子结果$F[i, v − C_i]$,所以就可以并且必须采$v$递增的顺序循环。这就是这个简单的程序为何成立的道理。值得一提的是,上面的伪代码中两层 for 循环的次序可以颠倒。这个结论有可能会带来算法时间常数上的优化。这个算法也可以由另外的思路得出。例如,将基本思路中求解$F[i, v − C_i]$的状态转移方程显式地写出来,代入原方程中,会发现该方程可以等价地变形成这种形式:
将这个方程用一维数组实现,便得到了上面的伪代码。
最后抽象出处理一件完全背包类物品的过程伪代码:
【注解:O(VN)优化的核心思想是对于总费用$v$,要么第$i$件物品一个都不放,即$F[i, v]取max左半边;要么第$i$件物品可以一直放,即取max右半边$F[i, v - C_i] + W_i$。相较于01背包逆序($V~C_i$)迭代确保每一次更新都源于上一层$i - 1$,从而实现了0或1的约束,完全背包的顺序迭代($C_i~V$)确保了更新源于本层$i$,即可以重复多次放】
小结
完全背包问题也是一个相当基础的背包问题,它有两个状态转移方程。希望读者能够对这两个状态转移方程都仔细地体会,不仅记住,也要弄明白它们是怎么得出来的,最好能够自己想一种得到这些方程的方法。事实上,对每一道动态规划题目都思考其方程的意义以及如何得来,是加深对动态规划的理解、提高动态规划功力的好方法。
多重背包
题目
有$N$种物品和一个容量为$V$的背包。第$i$种物品最多有$M_i$件可用,每件耗费的空间是$C_I$,价值是$W_i$。求解将哪些物品装入背包可使这些物品的耗费的空间总和不超过背包容量,且价值总和最大。
基本算法
这题目和完全背包问题很类似。基本的方程只需将完全背包问题的方程略微一改即可。因为对于第$i$种物品有$M_I + 1$种策略:取$0$件,取$1$件……取$M_i$件。令$F[i, v]$表示前$i$种物品恰放入一个容量为$v$的背包的最大价值,则有状态转移方程:
复杂度是$O(Vsum M_i)$。
转化为01背包问题
另一种好想好写的基本方法是转化为 01 背包求解:把第$i$种物品换成$M_i$件 01背包中的物品,则得到了物品数为$sum M_i$的 01 背包问题。直接求解之,复杂度仍然是$O(Vsum M_i)$。但是我们期望将它转化为 01 背包问题之后,能够像完全背包一样降低复杂度。仍然考虑二进制的思想,我们考虑把第$i$种物品换成若干件物品,使得原问题中第$i$种物品可取的每种策略——取$0dots M_i$件——均能等价于取若干件代换以后的物品。另外,取超过$M_i$件的策略必不能出现。
方法是:将第$i$种物品分成若干件 01 背包中的物品,其中每件物品有一个系数。这件物品的费用和价值均是原来的费用和价值乘以这个系数。令这些系数分别为$1, 2, 2^2dots 2^{k−1} , M_i - 2^k + 1$,且$k$是满足$M_i − 2^k + 1 > 0$的最大整数。例如,如果$M_i$为 13 ,则相应的$k = 3$,这种最多取$13$件的物品应被分成系数分别为$1, 2, 4, 6$的四件物品。
分成的这几件物品的系数和为$M_i$,表明不可能取多于$M_i$件的第$i$种物品。另外这种方法也能保证对于$0dots M_i$间的每一个整数,均可以用若干个系数的和表示。这里算法正确性的证明可以分$0dots 2^k − 1$和$2^kdots M_i$两段来分别讨论得出,希望读者自己思考尝试一下。
【注解:$0dots 2^k − 1$这一段采用二进制思想可覆盖$0~2^k - 1$个物品范围,而$2^kdots M_i$则可覆盖剩余部分】
这样就将第$i$种物品分成了$O(log M_i)$种物品,将原问题转化为了复杂度为$O(Vlog M_i)$的 01 背包问题,是很大的改进。下面给出O(log M_i)时间处理一件多重背包中物品的过程:
希望你仔细体会这个伪代码,如果不太理解的话,不妨翻译成程序代码以后,单步执行几次,或者头脑加纸笔模拟一下,以加深理解。
可行性问题 O(V N) 的算法
当问题是“每种有若干件的物品能否填满给定容量的背包”,只须考虑填满背包的可行性,不需考虑每件物品的价值时,多重背包问题同样有$O(VN)$复杂度的算法。例如,可以使用单调队列的数据结构,优化基本算法的状态转移方程,使每个状态的值可以以均摊$O(1)$的时间求解。(楼天成的“男人八题”幻灯片)
【注解:单调队列的优化解法待挖掘】
下面介绍一种实现较为简单的$O(VN)$复杂度解多重背包问题的算法。它的基本思想是这样的:设$F[i, j]$表示“用了前$i$种物品填满容量为$j$的背包后,最多还剩下几个第$i$种物品可用”,如果$F[i, j] = −1$则说明这种状态不可行,若可行应满足$0 ≤ F[i, j] ≤ M_i$。递推求$F[i, j]$的伪代码如下:
最终$F[N][0dots V]$便是多重背包可行性问题的答案。
小结
在这一讲中,我们看到了将一个算法的复杂度由$O(Vsum M_i)$改进到$O(Vlog M_i)$的过程,还知道了存在复杂度为$O(VN)$的算法。希望你特别注意“拆分物品”的思想和方法,自己证明一下它的正确性,并将完整的程序代码写出来。
混合三种背包
问题
如果将前面1、2、3中的三种背包问题混合起来。也就是说,有的物品只可以取一次( 01 背包),有的物品可以取无限次(完全背包),有的物品可以取的次数有一个上限(多重背包)。应该怎么求解呢?
01背包与完全背包的混合
考虑到 01 背包和完全背包中给出的伪代码只有一处不同,故如果只有两类物品:一类物品只能取一次,另一类物品可以取无限次,那么只需在对每个物品应用转移方程时,根据物品的类别选用顺序或逆序的循环即可,复杂度是$O(VN)$。伪代码如下:
再加上多重背包
如果再加上最多可以取有限次的多重背包式的物品,那么利用单调队列,也可以给出均摊$O(VN)$的解法。但如果不考虑单调队列算法的话,用将每个这类物品分成$O(log M_i)$个 01 背包的物品的方法也已经很优了。最清晰的写法是调用我们前面给出的三个过程。
在最初写出这三个过程的时候,可能完全没有想到它们会在这里混合应用。我想这体现了编程中抽象的威力。如果你一直就是以这种“抽象出过程”的方式写每一类背包问题的,也非常清楚它们的实现中细微的不同,那么在遇到混合三种背包问题的题目时,一定能很快想到上面简洁的解法,对吗?
小结
有人说,困难的题目都是由简单的题目叠加而来的。这句话是否公理暂且存之不论,但它在本讲中已经得到了充分的体现。本来 01 背包、完全背包、多重背包都不是什么难题,但将它们简单地组合起来以后就得到了这样一道一定能吓倒不少人的题目。但只要基础扎实,领会三种基本背包问题的思想,就可以做到把困难的题目拆分成简单的题目来解决。
基础代码实现(C++)
/*背包问题 * 三种背包:01背包,完全背包(无限),多重背包的经典动态规划解法 *一般性答案是求最大价值。其中第i种物品的费用Cost是Ci,每个价值为Wi *提目输入为物品的种类N,每种物品的数量范围0~k,背包容量M *01背包每种物品最多放1个,完全背包煤种个数不限,所以由背包容量限制:0~M/Ci, *多重背包则多一个参数:0~Pi(Pi*Ci>M时可视为完全背包问题) *三种背包的函数以每种物品的放入情况为单位进行调用,因此可各自独立分析 * */ #include<iostream> #include<vector> using namespace std; vector<int> C; vector<int> W; vector<int> P; vector<int> G;//保存最佳方案结果 vector<vector<int> > ff; vector<int> f;//推荐用优化的一维数组!!! void ZeroPack1(int wi, int ci, int m) { // //初始化部分 f[0] = 0; //递归部分 for(int j = m + 1; j > ci; j--) f[j] = max(f[j], f[j - ci] + wi); } void PerfectPack1(int wi, int ci, int m) { //初始化部分 f[0] = 0; //递归部分 for(int j = ci; j < m + 1; j++) f[j] = max(f[j], f[j - ci] + wi); } void MultiPack1(int pi, int wi, int ci, int m) { //按照每种物品的具体情况单独处理 if(pi * ci > m){ PerfectPack1(wi, ci, m); return; } else{ int k = 1; while(k < pi) { ZeroPack1(wi * k, ci * k, m); pi -= k; k *= 2; } ZeroPack1(wi * pi, ci * pi, m); //此时pi已经变成了pi - (2^k - 1) = pi - 2^k + 1 } } void ZeroPack(int i, int wi, int ci, int m) { //i的取值范围0~n-1 //初始化部分 ff[i][0] = 0; for(int j = 0; j < m + 1; j++) { if(C[0] >= j) ff[0][j] = W[0]; else ff[0][j] = 0; } //递归部分 for(int j = 1; j < m + 1; j++) { if(j >= ci) ff[i][j] = max(ff[i - 1][j], ff[i - 1][j - ci] + wi); else ff[i][j] = ff[i - 1][j]; } } void PerfectPack(int i, int wi, int ci, int m) { //初始化部分 ff[i][0] = 0; for(int j = 1; j < m + 1; j++) { int k = 0; while(j > k * C[0]) k++; ff[0][j] = W[0] * (k - 1); } //递归部分 for(int j = 1; j < m + 1; j++) { int k = 0; while(j >= ci * k) k++; k--; ff[i][j] = max(ff[i - 1][j], ff[i - 1][j - ci * k] + wi * k); } } void MultiPack(int i, int wi, int ci, int m){ //按照每种物品的具体情况单独处理 int pi = P[i]; if(pi * ci > m) { PerfectPack(i, wi, ci, m); return; } else{ int k = 1; while(k < pi) { ZeroPack(i, wi * k, ci * k, m); pi -= k; k *= 2; } ZeroPack(i, wi * pi, ci * pi, m);//此时pi已经变成了pi - (2^k - 1) = pi - 2^k + 1 } } void printRes(int n, int m){ for(int i = 0;i < n; i++){ for(int j = 0; j < m + 1; j++) { if(ff[i][j] == ff[i - 1][j]) G[i] = 0;//第i种物品(一个)放进背包 else G[i] = 1;//第i种物品没放进背包 } } for(auto i : G) cout << i; cout << endl; } int main(){ int N, M; cin >> N >> M;//物品种类数和背包容量 ff.resize(N); for(int i = 0; i < N; i++) ff[i].resize(M); int i = 0, tmp; while(i < N){ cin >> tmp;//每种物品的费用(体积、重量) C.push_back(tmp); i++; } i=0; while(i < N){ cin >> tmp;//每种物品的单价 W.push_back(tmp); i++; } while(i < N){ cin >> tmp;//每种物品的限制数量 P.push_back(tmp); i++; } for(int i = 0; i < N; i++){ ZeroPack1(W[i], C[i], M); PerfectPack1(W[i], C[i], M); MultiPack1(P[i], W[i], C[i], M); //ZeroPack(i, W[i], C[i], M); //PerfectPack(i, W[i], C[i], M); //MultiPack(i, W[i], C[i], M); } printRes(N, M); return 0; }
二维费用的背包
问题
二维费用的背包问题是指:对于每件物品,具有两种不同的费用,选择这件物品必须同时付出这两种费用。对于每种费用都有一个可付出的最大值(背包容量)。问怎样选择物品可以得到最大的价值。设第$i$件物品所需的两种费用分别为$C_i$和$D_i$。两种费用可付出的最大值(也即两种背包容量)分别为$V$和$U$。物品的价值为$W_i$。
算法
费用加了一维,只需状态也加一维即可。设$F[i, v, u]$表示前$i$件物品付出两种费用分别为$v$和$u$时可获得的最大价值。状态转移方程就是:
如前述优化空间复杂度的方法,可以只使用二维的数组:当每件物品只可以取一次时变量$v$和$u$采用逆序的循环,当物品有如完全背包问题时采用顺序的循环,当物品有如多重背包问题时拆分物品。这里就不再给出伪代码了,相信有了前面的基础,读者应该能够自己实现出这个问题的程序。
物体总个数的限制
有时,“二维费用”的条件是以这样一种隐含的方式给出的:最多只能取$U$件物品。这事实上相当于每件物品多了一种“件数”的费用,每个物品的件数费用均为$1$,可以付出的最大件数费用为$U$。换句话说,设$F[v, u]$表示付出费用$v$、最多选$u$件时可得到的最大价值,则根据物品的类型( 01 、完全、多重)用不同的方法循环更新,最后在$f[0dots V, 0dots U]$范围内寻找答案。
复整数域上的背包问题
另一种看待二维背包问题的思路是:将它看待成复整数域上的背包问题。也就是说,背包的容量以及每件物品的费用都是一个复整数。而常见的一维背包问题则是自然数域上的背包问题。所以说,一维背包的种种思想方法,往往可以应用于二维背包问题的求解中,因为只是数域扩大了而已。作为这种思想的练习,你可以尝试将后文中提到的“子集和问题”扩展到二维,并试图用同样的复杂度解决。
小结
当发现由熟悉的动态规划题目变形得来的题目时,在原来的状态中加一维以满足新的限制是一种比较通用的方法。希望你能从本讲中初步体会到这种方法。
【注解:二维背包问题,甚至多维背包问题,其实就是将限制条件(费用)由一项扩展为了多项,实际代码实现时增加一个维度对应增加一层迭代,时空复杂度也对应增加。】
分组的背包
问题
有$N$件物品和一个容量为$V$的背包。第$i$件物品的费用$C_i$,价值是$W_i$。这些物品被划分为$K$组,每组中的物品互相冲突,最多选一件。求解将哪些物品装入背包可使这些物品的费用总和不超过背包容量,且价值总和最大。
算法
这个问题变成了每组物品有若干种策略:是选择本组的某一件,还是一件都不选。也就是说设$F[k, v]$表示前$k$组物品花费费用$v$能取得的最大权值,则有:
使用一维数组的伪代码如下:
这里三层循环的顺序保证了每一组内的物品最多只有一个会被添加到背包中。另外,显然可以对每组内的物品应用2.3中的优化。
小结
分组的背包问题将彼此互斥的若干物品称为一个组,这建立了一个很好的模型。不少背包问题的变形都可以转化为分组的背包问题(例如 8 ),由分组的背包问题进一步可定义“泛化物品”的概念,十分有利于解题。
有依赖的背包
简化的问题
这种背包问题的物品间存在某种“依赖”的关系。也就是说,物品$i$依赖于物品$j$,表示若选物品$i$,则必须选物品$j$。为了简化起见,我们先设没有某个物品既依赖于别的物品,又被别的物品所依赖;另外,没有某件物品同时依赖多件物品。
算法
这个问题由 NOIP2006 中“金明的预算方案”一题扩展而来。遵从该题的提法,将不依赖于别的物品的物品称为“主件”,依赖于某主件的物品称为“附件”。由这个问题的简化条件可知所有的物品由若干主件和依赖于每个主件的一个附件集合组成。按照背包问题的一般思路,仅考虑一个主件和它的附件集合。可是,可用的策略非常多,包括:一个也不选,仅选择主件,选择主件后再选择一个附件,选择主件后再选择两个附件……无法用状态转移方程来表示如此多的策略。事实上,设有$n$个附件,则策略有$2^n + 1$个,为指数级。
考虑到所有这些策略都是互斥的(也就是说,你只能选择一种策略),所以一个主件和它的附件集合实际上对应于 7 中的一个物品组,每个选择了主件又选择了若干个附件的策略对应于这个物品组中的一个物品,其费用和价值都是这个策略中的物品的值的和。但仅仅是这一步转化并不能给出一个好的算法,因为物品组中的物品还是像原问题的策略一样多。
再考虑对每组内的物品应用 2.3 中的优化。我们可以想到,对于第$k$个物品组中的物品,所有费用相同的物品只留一个价值最大的,不影响结果。所以,可以对主件$k$的“附件集合”先进行一次 01 背包,得到费用依次为$0dots V − C_k$所有这些值时相应的最大价值$F_k [0dots V − C_k]$。那么,这个主件及它的附件集合相当于$V − C_k + 1$个物品的物品组,其中费用为$v$的物品的价值为$F_k [v − C_k] + W_k$,$v$的取值范围是$C_k ≤ v ≤ V$。也就是说,原来指数级的策略中,有很多策略都是冗余的,通过一次 01 背包后,将主件$k$及其附件转化为$V − C_k + 1$个物品的物品组,就可以直接应用 7 的算法解决问题了。
【注解:简单问题优化后实际上就是分组背包问题,且每个物品组内地物品是互斥的(即要么不选,要么只能选一个)。一共$k$个物品组,每个物品组内有$V - C_k + 1$个互斥物品可供选择。这$V - C_k + 1$个“物品”是经过01背包优化后选出来的费用相同(0 ~ V - C_k)情况下价值最大的物品组合体。】
较一般的问题
更一般的问题是:依赖关系以图论中“森林” (多叉树的集合)的形式给出。也就是说,主件的附件仍然可以具有自己的附件集合。限制只是每个物品最多只依赖于一个物品(只有一个主件)且不出现循环依赖。
【注解:一对多的依赖关系。】
解决这个问题仍然可以用将每个主件及其附件集合转化为物品组的方式。唯一不同的是,由于附件可能还有附件,就不能将每个附件都看作一个一般的 01 背包中的物品了。若这个附件也有附件集合,则它必定要被先转化为物品组,然后用分组的背包问题解出主件及其附件集合所对应的附件组中各个费用的附件所对应的价值。
事实上,这是一种树形动态规划,其特点是,在用动态规划求每个父节点的属性之前,需要对它的各个儿子的属性进行一次动态规划式的求值。这已经触及到了“泛化物品”的思想。看完 9 后,你会发现这个“依赖关系树”每一个子树都等价于一件泛化物品,求某节点为根的子树对应的泛化物品相当于求其所有儿子的对应的泛化物品之和。
【注解:树形结构的问题一般都会想到递归思想,这里其实就是父问题(主件及其附件的组合问题)drill down到子问题(附件及其附件的组合问题)再drill down。。。直到附件没有附件,即可使用01背包求得最佳附件组,再不断回溯父问题使用01背包求解,直到根结点得到最佳方案。】
小结
NOIP2006 的那道背包问题我做得很失败,写了上百行的代码,却一分未得。后来我通过思考发现通过引入“物品组”和“依赖”的概念可以加深对这题的理解,还可以解决它的推广问题。用物品组的思想考虑那题中极其特殊的依赖关系:物品不能既作主件又作附件,每个主件最多有两个附件,可以发现一个主件和它的两个附件等价于一个由四个物品组成的物品组,这便揭示了问题的某种本质。
后来,我在《背包问题九讲》第一版中总结此事时说:“失败不是什么丢人的事情,从失败中全无收获才是。”之后的 NOIP2007 的比赛中,我得了满分。
泛化物品
定义
考虑这样一种物品,它并没有固定的费用和价值,而是它的价值随着你分配给它的费用而变化。这就是泛化物品的概念。
更严格的定义之。在背包容量为$V$的背包问题中,泛化物品是一个定义域为$0dots V$中的整数的函数$h$,当分配给它的费用为$v$时,能得到的价值就是$h(v)$。这个定义有一点点抽象,另一种理解是一个泛化物品就是一个数组$h[0dots V ]$,给它费用$v$,可得到价值$h[v]$。
一个费用为$c$价值为$w$的物品,如果它是 01 背包中的物品,那么把它看成泛化物品,它就是除了$h(c) = w$外,其它函数值都为$0$的一个函数。如果它是完全背包中的物品,那么它可以看成这样一个函数,仅当$v$被$c$整除时有$h(v) = w · frac{v}{c}$,其它函数值均为$0$。如果它是多重背包中重复次数最多为$m$的物品,那么它对应的泛化物品的函数有$h(v) = w · frac{v}{c}$仅当$v$被$c$整除且$frac{v}{c} ≤ m$,其它情况函数值均为$0$。
【注解:最后一行的$n$应为$m$】
一个物品组可以看作一个泛化物品$h$。对于一个$0dots V$中的$v$,若物品组中不存在费用为$v$的物品,则$h(v) = 0$,否则$h(v)$取值为所有费用为$v$的物品的最大价值。 7 中每个主件及其附件集合等价于一个物品组,自然也可看作一个泛化物品。
泛化物品的和
如果给定了两个泛化物品$h$和$l$,要用一定的费用从这两个泛化物品中得到最大的价值,这个问题怎么求呢?事实上,对于一个给定的费用$v$,只需枚举将这个费用如何分配给两个泛化物品就可以了。同样的,对于$0dots V$中的每一个整数$v$,可以求得费用$v$分配到$h$和$l$中的最大价值$f(v)$。也即
可以看到,这里的$f$是一个由泛化物品$h$和$l$决定的定义域为$0dots V$的函数,也就是说,$f$是一个由泛化物品$h$和$l$决定的泛化物品。
我们将$f$定义为泛化物品$h$和$l$的和:$h$、$l$都是泛化物品,若函数$f$满足以上关系式,则称$f$是$h$与$l$的和。泛化物品和运算的时间复杂度取决于背包的容量,是$O(V^2)$。由泛化物品的定义可知:在一个背包问题中,若将两个泛化物品代以它们的和,不影响问题的答案。事实上,对于其中的物品都是泛化物品的背包问题,求它的答案的过程也就是求所有这些泛化物品之和的过程。若问题的和为$s$,则答案就是$s(0dots V)$中的最大值。
背包问题的泛化物品
一个背包问题中,可能会给出很多条件,包括每种物品的费用、价值等属性,物品之间的分组、依赖等关系等。但肯定能将问题对应于某个泛化物品。也就是说,给定了所有条件以后,就可以对每个非负整数$v$求得:若背包容量为$v$,将物品装入背包可得到的最大价值是多少,这可以认为是定义在非负整数集上的一件泛化物品。这个泛化物品——或者说问题所对应的一个定义域为非负整数的函数——包含了关于问题本身的高度浓缩的信息。一般而言,求得这个泛化物品的一个子定义域(例如$0dots V$)的值之后,就可以根据这个函数的取值得到背包问题的最终答案。综上所述,一般而言,求解背包问题,即求解这个问题所对应的一个函数,即该问题的泛化物品。而求解某个泛化物品的一种常用方法就是将它表示为若干泛化物品的和然后求之。
【注释:背包问题本质上就是一个根据泛化物品(条件)求解其对应函数的问题,该函数可以根据泛化物品的拆分进行相应的拆分求解。】
小结
本讲是我在学习函数式编程的 Scheme 语言时,用函数编程的眼光审视各类背包问题得出的理论。我想说:“思考”是一个程序员最重要的品质。简单的问题,深入思考以后,也能发现更多。
背包问题问法的变化
以上涉及的各种背包问题都是要求在背包容量(费用)的限制下求可以取到的最大价值,但背包问题还有很多种灵活的问法,在这里值得提一下。但是我认为,只要深入理解了求背包问题最大价值的方法,即使问法变化了,也是不难想出算法的。例如,求解最多可以放多少件物品或者最多可以装满多少背包的空间。这都可以根据具体问题利用前面的方程求出所有状态的值($F$数组)之后得到。还有,如果要求的是“总价值最小”“总件数最小”,只需将状态转移方程中的$max$改成$min$即可。下面说一些变化更大的问法。
输出方案
一般而言,背包问题是要求一个最优值,如果要求输出这个最优值的方案,可以参照一般动态规划问题输出方案的方法:记录下每个状态的最优值是由状态转移方程的哪一项推出来的,换句话说,记录下它是由哪一个策略推出来的。便可根据这条策略找到上一个状态,从上一个状态接着向前推即可。
还是以 01 背包为例,方程为$F[i, v] = max {F[i − 1, v], F[i − 1, v − C_i] + W_i}$。再用一个数组$G[i, v]$,设$G[i, v] = 0$表示推出$F[i, v]$的值时是采用了方程的前一项(也即$F[i, v] = F[i − 1, v]$),$G[i, v] = 1$表示采用了方程的后一项。注意这两项分别表示了两种策略:未选第$i$个物品及选了第$i$个物品。那么输出方案的伪代码可以这样写(设最终状态为$F[N, V]$):
另外,采用方程的前一项或后一项也可以在输出方案的过程中根据$F[i, v]$的值实时地求出来。也即,不须纪录$G$数组,将上述代码中的$G[i, v] = 0$改成$F[i, v] = F[i − 1, v]$,$G[i, v] = 1$改成$F[i, v] = F[i − 1][v − C_i ] + W_i$也可。
输出字典序最小的最优方案
这里“字典序最小”的意思是$1dots N$号物品的选择方案排列出来以后字典序最小。以输出 01 背包最小字典序的方案为例。一般而言,求一个字典序最小的最优方案,只需要在转移时注意策略。
首先,子问题的定义要略改一些。我们注意到,如果存在一个选了物品$1$的最优方案,那么答案一定包含物品$1$,原问题转化为一个背包容量为$V − C_1$,物品为$2dots N$的子问题。反之,如果答案不包含物品$1$,则转化成背包容量仍为$V$,物品为$2dots N$的子问题。不管答案怎样,子问题的物品都是以$idots N$而非前所述的$1dots i$的形式来定义的,所以状态的定义和转移方程都需要改一下。
但也许更简易的方法是,先把物品编号做$x ← N + 1 − x$的变换,在输出方案时再变换回来。在做完物品编号的变换后,可以按照前面经典的转移方程来求值。只是在输出方案时要注意,如果$F[i, v] = F[i − 1, v]$和$F[i, v] = F[i − 1][v − C_i ] + W_i$都成立,应该按照后者来输出方案,即选择了物品$i$,输出其原来的编号$N − 1 − i$。
【注解:最后的应该是$N + 1 - i$】
求方案总数
对于一个给定了背包容量、物品费用、物品间相互关系(分组、依赖等)的背包问题,除了再给定每个物品的价值后求可得到的最大价值外,还可以得到装满背包或将背包装至某一指定容量的方案总数。
对于这类改变问法的问题,一般只需将状态转移方程中的$max$改成$sum$即可。例如若每件物品均是完全背包中的物品,转移方程即为
初始条件是$F[0, 0] = 1$。事实上,这样做可行的原因在于状态转移方程已经考察了所有可能的背包组成方案。
最优方案总数
这里的最优方案是指物品总价值最大的方案。以 01 背包为例。结合求最大总价值和方案总数两个问题的思路,最优方案的总数可以这样求:$F[i, v]$代表该状态的最大价值,$G[i, v]$表示这个子问题的最优方案的总数,则在求$F[i, v]$的同时求$G[i, v]$的伪代码如下:
如果你是第一次看到这样的问题,请仔细体会上面的伪代码。
求次优解、第$K$优解
对于求次优解、第$K$优解类的问题,如果相应的最优解问题能写出状态转移方程、用动态规划解决,那么求次优解往往可以相同的复杂度解决,第$K$优解则比求最优解的复杂度上多一个系数$K$。
其基本思想是,将每个状态都表示成有序队列,将状态转移方程中的$max / min$转化成有序队列的合并。
这里仍然以 01 背包为例讲解一下。
首先看 01 背包求最优解的状态转移方程:$F[i, v] = max {F[i − 1, v], F[i − 1, v − C_i ] + W_i}$。如果要求第$K$优解,那么状态$F[i, v]$就应该是一个大小为$K$的队列$F[i, v, 1dots K]$ 。其中$F[i, v, k]$表示前$i$个物品中,背包大小为$v$时,第$k$优解的值。这里也可以简单地理解为在原来的方程中加了一维来表示结果的优先次序。显然$f[i, v, 1dots K]$这$K$个数是由大到小排列的,所以它可看作是一个有序队列。
然后原方程就可以解释为:$F[i, v]$这个有序队列是由$F[i − 1, v]$和$F[i − 1, v − C_i ] + W_i$这两个有序队列合并得到的。前者$F[i − 1][V]$即$F[i − 1, v, 1dots K]$,后者$F[i − 1, v − C_i] + W_i$则理解为在$F[i − 1,v − C_i ,1dots K]$的每个数上加上$W_i$后得到的有序队列。合并这两个有序队列并将结果的前$K$项储存到$f[i, v, 1dots K]$中的复杂度是$O(K)$。最后的第$K$优解的答案是$F[N, V, K]$。总的时间复杂度是$O(VNK)$。
为什么这个方法正确呢?实际上,一个正确的状态转移方程的求解过程遍历了所有可用的策略,也就覆盖了问题的所有方案。只不过由于是求最优解,所以其它在任何一个策略上达不到最优的方案都被忽略了。如果把每个状态表示成一个大小为$K$的数组,并在这个数组中有序地保存该状态可取到的前$K$个最优值。那么,对于任两个状态的$max$运算等价于两个由大到小的有序队列的合并。
另外还要注意题目对于“第$K$优解”的定义,是要求将策略不同但权值相同的两个方案是看作同一个解还是不同的解。如果是前者,则维护有序队列时要保证队列里的数没有重复的。
【注解:核心思想是转移方程遍历了所有的可能,因此可开辟新的一维用于存储方案序列。】
小结
显然,这里不可能穷尽背包类动态规划问题所有的问法。甚至还存在一类将背包类动态规划问题与其它领域(例如数论、图论)结合起来的问题,在这篇论背包问题的专文中也不会论及。但只要深刻领会前述所有类别的背包问题的思路和状态转移方程,遇到其它的变形问题,应该也不难想出算法。触类旁通、举一反三,应该也是一个程序员应有的品质吧。
【定有错漏,欢迎指正!】