最优控制论读书笔记
1. 变分与最优控制
在数学中, 考虑函数的最值或者极值是也一件十分重要的事情, 在一般意义下, 我们通常考虑如下问题.
设 为非空集, 为函数, 我们寻找 的最小值与最大值.
这个问题无论对应数学本身还是对应用数学而言都有者作用的意义, 谁人不关心自己的投资, 谁不想自己的投资获得最大回报, 谁不想如果损失不可避免, 那么让损失尽可能地小. 类似于这样的想法, 凸显出寻找函数最值具备的重要意义.
不过这样的问题太过一般, 因此很难给出一个有效的办法, 因此在人们处理问题的办法是, 先研究这个问题最简单的情况.于是就有如下版本.
设 为非空集, 我们在很多情况下关心函数
的最小值与最大值.
当然, 我们将涉及到两个基本的问题.
- 函数 是否存在最小值与最大值.
- 如果函数 存在最小值与最大值, 那么如何刻画 的最小值点或最大值点.
我们先来讨论最值的存在性.
事实上, 函数的最值的存在性并不是一个简单的问题, 目前针对 和 添加若干限制, 我们能知道其存在性. 比如
紧性: 也就是 是紧集, 且 连续, 那么由 Karl Weierstrass 的最连续函数的最大值最小值存在定理我们立刻知道 的最大值与最小值都存在.
强制性条件: 若 , 且 连续, 并满足
那么 存在最小值.
当然还有各种各样的条件.
当然, 这种存在性的研究是一件重要的事情, 不过这不是直接的, 在这证明存在之后,具体如何找打这些最值点就变得是否要紧了.
历史上, 人们也的确走了另外一条路, 也就是在假定 的最值存在的条件下(不管其是真正的存在或者只是一种假定), 人们考虑这些最值点应该会满足什么性质, 然后沿着这些性质去寻找相应的最值点, 这种思路在历史上最成功的一个办法之一应该是由著名数学家 Fermat 观察到, 也就是下面著名的引理.
Fermat 引理: 假设函数 在 处取极值, 并且 在 处可微, 则
这个引理给了我们一个寻找函数 最值点的一个途径, 也就是在 的零点集
中去寻找 的最值点. 不可否则, 如果函数 的导函数 容易计算, 并且 的零点集容易计算的话, 那么这个办法将是相当有效的.
当然, 这里考虑的函数的定义域落在一维空间上的情形, 在一维空间取得的成就人们自然会想办法将其拓展到高维空间.
当然, 上面这个简单的版本, 注意, 只是形式上的简单, 当遇到 的导函数不存在或者 的零点很难计算的时候, 这个简单的版本也不会简单.
在考虑了上面这个简单的版本之后, 人们自然希望拓展这中类型的办法, 自然的想法当然还是限制函数的定义域. 因此有了如下的考虑.
设 , 是定义在 上的函数, 如果
非空, 我们自然希望考虑 在 上的最值点.
在这里需要注意的, 当 足够复杂的时候, 可能十分的复杂, 因此这个问题是不会简单的. 当然如果将 进行适当的限制, 那么 可能会是 中我们相当熟悉的集, 比如是闭集, 紧集之类的.
在这方面, 类似于 Fermat 当年的思路, 目前知道十分有效的办法是 Lagrange 乘子法. 在这里不补充详细的细节.
当然, 随着研究范围的扩大, 首先出现的一类问题是当 为某类函数空间.
例: 设 为 中的某个曲面, , 为 上两点, 一个自然的问题是考虑曲面上连接 , 两点的所有路径中路程最段的.
其中
当然, 由于 的复杂性以及未来会演变为流形 , 这就导致这个问题是如此的不平凡和值得研究.
2. 最优控制的一般性概念
想从数学的角度清楚地对控制系统下一个定义是困难的, 控制论研究的目的在于搞清楚复杂系统内部各个因素之间的联系, 并达到对系统进行控制达到我们目的, 因此我们面对的系统必然是各式各样且复杂的, 因此要数学意义上统一模型化和公理化是困难的.
通常一个控制系统包含一些输入变量, 一些输出变量.
我们这里不对控制系统进行定义, 而是对控制系统进行公理化的办法, 在数学上, 如果我们可以从输出完整地将状态构造出来, 则我们称这个系统是完全能观的.
作为控制系统, 我们关心其能控性, 能观性, 注意这里的能控制性与能观性在更进一的层次需要进行细致区分, 也就是说, 不同的能控性有着细致的区别, 我们要将其区别出来, 能观性也是有区别的, 我们要在数学意义下将其区别出来, 模糊地描述某个概念是没有好处的, 就像我们经常谈论对称性意义, 事实上, 不同结构的对称性是有区别的, 这个区别的工具在数学上可以用各种不同的对称群来进行区别, 同样, 能控性, 能观性也一样, 我们要适当发展合适的数学概念或者工具, 将其进行区别, 就算没有办法对一般的控制系统进行区别, 那么对于一些特殊的控制系统, 发展合适的工具进行区别, 这也是必须要经历的步骤, 也是控制论必须要走的历程.
下面我们描述一种典型的控制模型
其中
是系统的状态函数,
是系统的控制函数,
系统的演化由微分方程 所刻画.
上面的系统到目前为止都还是一个形式系统, 还由许多没有描述清楚的东西, 必然控制函数 在哪个范围内选择, 另外, 状态函数的值域又是哪些.
为了描述问题的方便, 我们将集合 到集合 所有映射构成的集合记为 ,
限制我们将上面的描述固定下来.
定义: 设 , 我们称
我一阶常微分控制系统, 其中 称为状态方程. 称为控制函数空间.
定义: 对于控制系统
而言, 对于给定的初始条件 以及控制函数 , 如果控制系统存在解
则我们称此解 为控制系统在初始条件 和控制 下的状态轨线.