动态规划理论

学习笔记,来自数据结构与算法之美

动态规划问题的特点:符合一个模型,三个特征

  1. 一个模型:多阶段决策最优解模型
  2. 三个特征:
    最优子结构
    我们可以通过子问题的最优解,推导出问题的最优解。
    无后效性
    i.我们只关心前面阶段的状态值,而不关心这个状态是如何推导出来的。
    ii.某个阶段的状态一旦确定,就不受之后阶段的决策影响。
    重复子问题
    不同的决策序列,到达某个相同阶段时,可能会产生重复的状态。

两种常用的动态规划问题的解题思路

  1. 状态转移表法
    i.先用回溯算法的暴力搜索(可以用回溯加“备忘录”的方法)
    ii.定义状态
    iii.画出递归树
    iv.观察递归树中重复子问题的规律
    v.画出状态转移表

  2. 状态转移方程法
    i.先用回溯算法的暴力搜索
    ii.定义状态
    iii.画出递归树
    iv.观察递归树中重复子问题的规律
    v.画出状态转移方程
    vi. 递归加“备忘录”方法 ,或者 迭代递归方法

其他

比较四种算法思想,贪心、分治、回溯和动态规划看看它们之间有什么区别和联系。

如果我们将这四种算法思想分一下类,那贪心、回溯、动态规划可以归为一类,而分治单独可以作为一类,因为它跟其他三个都不大一样。为什么这么说呢?前三个算法解决问题的模型,都可以抽象成我们今天讲的那个多阶段决策最优解模型,而分治算法解决的问题尽管大部分也是最优解问题,但是,大部分都不能抽象成多阶段决策模型。

回溯算法是个“万金油”。基本上能用的动态规划、贪心解决的问题,我们都可以用回溯算法解决。回溯算法相当于穷举搜索。穷举所有的情况,然后对比得到最优解。不过,回溯算法的时间复杂度非常高,是指数级别的,只能用来解决小规模数据的问题。对于大规模数据的问题,用回溯算法解决的执行效率就很低了。

尽管动态规划比回溯算法高效,但是,并不是所有问题,都可以用动态规划来解决。能用动态规划解决的问题,需要满足三个特征,最优子结构、无后效性和重复子问题。在重复子问题这一点上,动态规划和分治算法的区分非常明显。分治算法要求分割成的子问题,不能有重复子问题,而动态规划正好相反,动态规划之所以高效,就是因为回溯算法实现中存在大量的重复子问题。

贪心算法实际上是动态规划算法的一种特殊情况。它解决问题起来更加高效,代码实现也更加简洁。不过,它可以解决的问题也更加有限。它能解决的问题需要满足三个条件,最优子结构、无后效性和贪心选择性(这里我们不怎么强调重复子问题)。

其中,最优子结构、无后效性跟动态规划中的无异。“贪心选择性”的意思是,通过局部最优的选择,能产生全局的最优选择。每一个阶段,我们都选择当前看起来最优的决策,所有阶段的决策完成之后,最终由这些局部最优解构成全局最优解。

你可能感兴趣的:(动态规划理论)