动态规划:一

动态规划:一
动态规划

从取硬币开始谈起：

假设您是个土豪，身上带了足够的1，5，10，20，50，100元面值的钞票。现在您的目标是凑出某个金额 w ，需要用到尽量少的钞票。

显然我们可以用“贪心”的策略来解决这个问题：能用100就尽量用100，否则用50，以此类推。

贪心策略会尽快让 w 变得更小。能让 w 少100就尽量让它少100，这样我们接下来面对的局面就是凑出 w-100。长期的生活经验表明，贪心策略是正确的。但是，如果我们换一组钞票的面值，贪心策略就也许不成立了。如果一个奇葩国家的钞票面额分别是

1、5、11,那么我们在凑出15的时候，贪心策略会出错：

15=1×11+4×1 （贪心策略使用了5张钞票） 15=3×5
```
                     （正确的策略，只用3张钞票） 
```
为什么会这样呢？贪心策略错在了哪里？

鼠目寸光.

贪心是一种只考虑眼前情况的策略

动态转移方程

重新分析刚刚的例子。w=15时，我们如果取11，接下来就面对w=4的情况；如果取5，则接下来面对

w=10的情况。我们发现这些问题都有相同的形式：“给定w，凑出w所用的最少钞票是多少张？”

接下来，我们用

f(n)来表示“凑出n所需的最少钞票数量”。

那么，如果我们取了11，最后的代价（用掉的钞票总数）是多少呢？明显cost = f(4)+1 = 4+1 = 5,它的意义是：利用11来凑出15，付出的代价等于f(4)加上自己这一张钞票。现在我们暂时不管f(4)怎么求出来。依次类推，马上可以知道：如果我们用5来凑出15，cost就是f(10)+1 = 2+1 = 3

那么，现在w=15的时候，我们该取那种钞票呢？当然是各种方案中，cost值最低的那一个！

取11：

取5：

取1：
```
显而易见，cost值最低的是取5的方案。我们通过上面三个式子，做出了正确的决策！
```
这给了我们一个至关重要的启示——
相关；

更确切地说：

这个式子是非常激动人心的。这个式子也就是所谓的动态规划的状态转移方程，我们要求出f(n)，只需要求出几个更小的f值；既然如此，我们从小到大把所有的 f(i) 求出来不就好了？

我们以 O(n) 的复杂度解决了这个问题。现在回过头来，我们看看它的原理：

这两个事实，保证了我们做法的正确性。它比起贪心策略，会分别算出取1、5、11的代价，从而做出一个正确决策，这样就避免掉了“鼠目寸光”！
它与暴力的区别在哪里？我们的暴力枚举了“使用的硬币”，然而这属于冗余信息。我们要的是答案，根本不关心这个答案是怎么凑出来的。譬如，要求出f(15)，只需要知道f(14),f(10),f(4)的值。其他信息并不需要。我们舍弃了冗余信息。我们只记录了对解决问题有帮助的信息——f(n).我们能这样干，取决于问题的性质：求出f(n)，只需要知道几个更小的f(c)。我们将求解f(c)称作求解f(n)的“子问题"。

这就是DP（动态规划，dynamic programming）

将一个问题拆成几个子问题，分别求解这些子问题，即可推断出大问题的解。

思考题：请稍微修改代码，输出我们凑出w的方案。

几个简单原则

【无后效性】

一旦f(n)确定，“我们如何凑出f(n)”就再也用不着了。要求出f(15)，只需要知道f(14),f(10),f(4)的值，而

f(14),f(10),f(4)是如何算出来的，对之后的问题没有影响。

“未来与过去无关”，这就是无后效性.
（严格定义：如果给定某一阶段的状态，则在这一阶段以后过程的发展不受这阶段以前各段状态的影响。）

【最优子结构】
回顾我们对f(n)定义：我们记“凑出n所需的最少钞票数量”为f(n).
f(n)的定义就已经蕴含了“最优”。利用w=14,10,4的最优解，我们即可算出w=15的最优解。
大问题的最优解可以由小问题的最优解推出，这个性质叫做“最优子结构性质”.

引入这两个概念之后，我们如何判断一个问题能否使用DP解决呢？能将大问题拆成几个小问题，且满足无后效性、最优子结构性质。

动态规划的解题思路

【DP的操作过程】
一言以蔽之：

大事化小，小事化了。

将一个大问题转化成几个小问题；求解小问题；推出大问题的解。

【如何设计DP算法】

下面介绍比较通用的设计DP算法的步骤。首先，把我们面对的局面表示为x。这一步称为设计状态。对于状态x，记我们要求出的答案(e.g. 最小费用)为f(x).我们的目标是求出f(T). 找出f(x)与哪些局面有关（记为p），写出一个式子（称为状态转移方程），通过f(p)来推出f(x).

【DP三连】
设计DP算法，往往可以遵循DP三连：

我是谁？ ——设计状态，表示局面我从哪里来？我要到哪里去？ ——设计转移

设计状态是DP的基础。接下来的设计转移，有两种方式：一种是考虑我从哪里来（本文之前提到的两个例子，都是在考虑"我从哪里来”）；另一种是考虑我到哪里去，这常见于求出f(x)之后，更新能从x走到的一些解。这种DP也是不少的，我们以后会遇到。

例题

最长上升子序列（LIS）问题：

给定长度为n的序列a，从a中抽取出一个子序列，这个子序列需要单调递增。问最长的上升子序列（

LIS）的长度。 e.g. 1,5,3,4,6,9,7,8的LIS为1,3,4,6,7,8，长度为6。

如何设计状态（我是谁）？

状态x从哪里推过来（我从哪里来）？
相关阅读:
机器学习基础1--线性回归
 联想RD350板载RAID110i，安装CentOS 7 不识别RAID设备
 CentOS 7磁盘寻找不到，卡在sulogin，造成的开机失败问题--Error getting authority...
gitlab同步插件gitlab-mirrors报错<已解决,未找到原因>
马哥Linux SysAdmin学习笔记(四)
马哥Linux SysAdmin学习笔记(三)
马哥Linux SysAdmin学习笔记(二)
马哥Linux SysAdmin学习笔记(一)
php-round()四舍六入
 Linux权限问题(2)-unzip引发的权限问题
原文地址：https://www.cnblogs.com/jiangfengyang/p/10887029.html

最新文章
doc
doc
doc
doc
doc
doc
mitogen附带文件到远程主机
 归并排序算法
 机器学习基础8--矩阵分解
 机器学习基础7--推荐系统

动态规划

动态转移方程

几个简单原则

动态规划的解题思路

例题