动态规划 Dynamic programming

解决多阶段决策问题的最常用的最优化理论

原理就是把多阶段决策过程转化为一系列单阶段过程,利用各的阶段的递推关系,
逐个确定每个阶段的最优化决策

与分治法不同是,分治法的子问题之间是相互独立的,动态规划的子问题之间存在堆叠关系(递推关系式确定递推关系)

常见模型:线性模型,数字串模型,区间模型,状态压缩模型

thinking:最优化原理其实就是问题的最优子结构的性质,无论过去的状态和决策如何,对前面所形成
的状态而言,其后的决策必须构成最优策略。就是保证从现在开始的决策是之前决策的基础上的最优决策

无后向性:对某个特定子问题来说,它之前的各个阶段的子问题的决策只影响该阶段的决策,对该阶段之
后的决策不产生影响。

动态规划法的四个步骤:

1 定义最优子问题(最优解的子结构)

2 定义状态 (最优解的值)

3 定义决策和状态转换方程(定义计算最优解的方法)

4 确定边界条件

你可能感兴趣的:(动态规划 Dynamic programming)