算法:按步骤解决问题的过程。
An algorithm is a step-by-step procedure for solving a problem.
范式:思考问题的模式。
"Pattern of thought" which governs scientific apprehension during a certain period of time.
算法范式:为问题构建高效解决方案的常规方法。
General approaches to the construction of efficient solutions to problems。
算法范式可以被看做为解决一类问题的高层算法。
- 算法范式提供的模板可适用于解决更广泛的问题。
- 通过最高层的语言可以将范式转换成通用的组件或数据结构。
- 对算法产生结果所需的时间和空间的需求可以做精确的分析。
常见的算法范式有:
- 暴力破解法(Brute Force Paradigm)
- 分治法(Divide and Conquer Paradigm)
- 动态规划法(Dynamic Programming Paradigm)
- 贪心算法(Greedy Paradigm)
- 回溯法(Backtracking Paradigm)
- 分支限界法(Branch and Bound Paradigm)
暴力破解法(Brute Force Paradigm)
暴力破解法简单直接,根据问题声明的定义,找到所有可变化的因子(Divisor),穷举所有可能解决问题的方法,逐个尝试。
所以,根据暴力破解法的定义,理论上讲任何问题都可以使用暴力破解法来解决,只是在实际应用中算法对时间和空间的需求则无法满足。
将暴力破解法应用于数据查找,由于查找比较次数与给定目标的规模直接相关,所以也称为线性查找(Linear Search)。
线性查找有很多典型应用:
分治法(Divide and Conquer Paradigm)
分治法(Divide-and-Conquer),即 "分而治之",是将原问题划分成 n 个规模较小而结构与原问题相似的子问题,递归地解决这些问题,然后再合并其结果,以得到原问题的解。
当我们遇到一个大问题时,总是习惯把问题的规模变小,这样便于分析讨论。这些规模变小后的问题和原来的问题是同质的,除了规模变小,其它的都是一样的,本质上它还是同一个问题,规模变小后的问题其实是原问题的子问题。
分治模式在每一层上都有三个步骤:
- 分解(Divide):将原问题分解成一系列与原问题同质的子问题;
- 解决(Conquer):递归地解决各个子问题。若子问题足够小,则直接求解;
- 合并(Combine):将子问题的结果合并成原问题的解。
分治法所能解决的问题一般具有以下几个特征:
- 可以将问题分解为若干个规模较小的相同问题;
- 问题的规模缩小到一定程度后就可以很容易地解决;
- 问题分解出的子问题的解可以合并为该问题的解;
- 问题所分解出的各个子问题是相互独立的,即子问题之间不再包含公共的孙问题。
符合 1,2,3 条特征是使用分治法的关键,而特征 4 将涉及到分治法的效率问题。而如果不符合 3,4 特征的问题可以尝试考虑使用动态规划或贪心算法来解决。
分治法的典型应用:
动态规划法(Dynamic Programming Paradigm)
动态规划的过程可以描述为多阶段最优化解决问题的过程,每一次的决策依赖于当前的状态,随即又引起状态的转移,以此类推在变化的状态中产生出决策序列。
动态规划算法通常基于一个递推公式及一个或多个初始状态,当前子问题的解将由上一次子问题的解推出。使用动态规划来解题通常只需要多项式时间复杂度,所以会比回溯法、暴力法等要快许多。
动态规划方法中的关键词包括:阶段(Stage)、状态(State)、决策(Decision)、递推关系(Recurrent Relation)。
动态规划首先将待求解的问题分解为若干个子问题(阶段),按顺序求解子问题。前一子问题的解为后一子问题的求解提供了有用的信息。在求解任一子问题时,列出各种可能的局部解,通过决策保留那些有可能达到最优的局部解,丢弃其他局部解。以此类推解决各子问题,最后一个子问题的解就是初始问题的解。
动态规划与分治法最大的差别是:适合于用动态规划法求解的问题,经分解后得到的子问题往往不是互相独立的(即下一个子问题的求解是建立在上一个子问题的解的基础上,进行进一步的求解)。
动态规划所能解决的问题一般具有以下几个特征:
- 最优化原理(Mathematical Optimization):如果问题的最优解所包含的子问题的解也是最优的,就称该问题具有最优子结构(Optimal Substructure),即满足最优化原理。
- 无后效性:即某阶段状态一旦确定,就不受这个状态以后决策的影响。也就是说,某状态以后的过程不会影响以前的状态,只与当前状态有关。
- 有重叠子问题(Overlapping Subproblems):即子问题之间是不独立的,一个子问题在下一阶段决策中可能被多次使用到。
特征 3 并不是动态规划适用的必要条件,但是如果没有这条性质,动态规划算法同其他算法相比就不具备优势。
动态规划的基本步骤:
- 划分阶段:按照问题的时间或空间特征,把问题分为若干个阶段。注意划分后的阶段一定要是有序的或者是可排序的,否则问题就无法求解。
- 确定状态和状态变量:将问题发展到各个阶段时所处于的各种客观情况用不同的状态表示出来。状态的选择要满足无后效性。
- 确定决策并写出状态转移方程:因为决策和状态转移有着天然的联系,状态转移就是根据上一阶段的状态和决策来导出本阶段的状态。所以如果确定了决策,状态转移方程也就可写出。但事实上常常是反过来做,根据相邻两个阶段的状态之间的关系来确定决策方法和状态转移方程。
- 寻找边界条件:给出的状态转移方程是一个递推式,需要一个递推的终止条件或边界条件。
贪心算法(Greedy Paradigm)
所谓贪心算法是指,在对问题求解时,总是做出在当前看来最好的选择。也就是说,不从整体最优上加以考虑,它所做出的仅是在某种意义上的局部最优解。
贪心算法没有固定的算法框架,算法设计的关键是贪心策略的选择。贪心策略适用的前提是:局部最优策略能导致产生全局最优解。所以实际上,贪心算法适用的情况很少。
贪心算法不是对所有问题都能得到整体最优解,选择的贪心策略必须具备无后效性,即某个状态以后的过程不会影响以前的状态,只与当前状态有关。所以对所采用的贪心策略一定要仔细分析其是否满足无后效性。
贪心算法的基本思路:
- 建立数学模型来描述问题。
- 把求解的问题分成若干个子问题。
- 对每一子问题求解,得到子问题的局部最优解。
- 把子问题的解局部最优解合成原来问题的一个解。
回溯法(Backtracking Paradigm)
回溯法描述了一种选优搜索过程,按选优条件向前搜索,以达到目标。但当探索到某一步时,发现原先的选择并不优或达不到目标,就退回一步重新选择,这种走不通就退回再走的方法称为回溯法,而满足回溯条件的某个状态的点称为 "回溯点"。
回溯法可以理解为隐式的深度优先搜索算法。其在包含问题的所有解的解空间树中,按照深度优先搜索的策略,从根节点出发深度探索解空间树。当探索到某一节点时,要先判断该节点是否包含问题的解,如果包含,就从该节点出发继续探索下去,如果该节点不包含问题的解,则逐层向其祖先节点回溯。
许多复杂的,规模较大的问题都可以使用回溯法,有 "通用解题方法" 的美称。
回溯法的一般步骤:
- 针对给定问题,确定问题的解空间,问题的解空间应至少包含问题的一个(最优)解;
- 确定节点的扩展搜索规则;
- 以深度优先方式搜索解空间,并在搜索过程中用剪枝函数避免无效搜索;
分支限界法(Branch and Bound Paradigm)
类似于回溯法,分支限界法也是一种在问题的解空间树上搜索问题解的算法。但在一般情况下,分支限界法与回溯法的求解目标不同。回溯法的求解目标是找出树中满足约束条件的所有解,而分支限界法的求解目标则是找出满足约束条件的一个解,或是在满足约束条件的解中找出使某一目标函数值达到极大或极小的解,即在某种意义下的最优解。
所谓 "分支" 就是采用广度优先搜索算法,依次搜索节点的所有分支,抛弃不满足约束条件的节点,然后从余下的节点中选择一个节点作为下一个搜索节点继续搜索。
由于求解目标不同,导致分支限界法与回溯法在解空间树上的搜索方式也不相同。回溯法以深度优先的方式搜索解空间树,而分支限界法则以广度优先或以最小耗费优先的方式搜索解空间树。
分支限界法的搜索策略是:在扩展节点处,先生成其所有的儿子节点(分支),然后再从当前的活节点表中选择下一个扩展节点。为了有效地选择下一扩展节点,以加速搜索的进程,在每一活节点处,计算一个函数值(限界),并根据这些已计算出的函数值,从当前活节点表中选择一个最有利的节点作为扩展节点,使搜索朝着解空间树上有最优解的分支推进,以便尽快地找出一个最优解。
参考资料
- 动态规划:从新手到专家
- 动态规划之背包问题
- 最长递增子序列 O(NlogN)算法
- 五大常用算法之一:分治算法
- 五大常用算法之二:动态规划算法
- 五大常用算法之三:贪心算法
- 五大常用算法之四:回溯法
- 五大常用算法之五:分支限界法
- 通过金矿模型介绍动态规划
- 漫谈算法(三)NP问题
- 基础算法系列总结:动态规划
- 基础算法系列总结:贪心算法
- 基础算法系列总结:回溯算法
- 基础算法系列总结:分支限界算法
- Dynamic Programming | Set 1 (Overlapping Subproblems Property)
- Dynamic Programming | Set 2 (Optimal Substructure Property)
- Dynamic Programming | Set 3 (Longest Increasing Subsequence)
- Dynamic Programming | Set 4 (Longest Common Subsequence)
- Dynamic Programming | Set 5 (Edit Distance)
- Dynamic Programming | Set 6 (Min Cost Path)
- 6.006- Introduction to Algorithms - Lecture 18