线性,整数,非线性,动态规划

线性规划

  • 线性规划(Linear Programming 简记 LP)则是数学规划的一个重要分支。

  • 自从 1947 年 G. B. Dantzig 提出求解线性规划的单纯形方法以来,线性规划在理论上趋向成熟

    • 目标函数
    • 约束条件,记为 s.t.(即 subject to)
    • 目标函数及约束条件均为线性函数,故被称为线性规划问题。
    • 线性规划的 Matlab 标准形式

      • [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-T01W3XxU-1633779106919)(C:/Users/23105/AppData/Roaming/Typora/typora-user-images/image-20211009151645757.png)]

      • 其中 cxn 维列向量, AAeq 为适当维数的矩阵,bbeq 为适当维数的列向量。

        • 线性规划
          • [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-3XCl5pBy-1633779106921)(C:/Users/23105/AppData/Roaming/Typora/typora-user-images/image-20211009151749505.png)]
        • Matlab 标准型
          • [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-ioLtJwkS-1633779106923)(C:/Users/23105/AppData/Roaming/Typora/typora-user-images/image-20211009151830161.png)]
  • 可行解 满足约束条件的解

  • 可行域 所有可行解构成的集合,记为 R

整数规划

  • 规划中的变量(部分或全部)限制为整数时,称为整数规划。

  • 若在线性规划模型中,变量限制为整数,则称为整数线性规划。

    • 求解方法分类:

      • 分枝定界法—可求纯或混合整数线性规划。

        • 把全部可行解空间反复地分割为越来越小的子集,称为分枝;

        • 对每个子集内的解集计算一个目标下界(对于最小值问题),这称为定界

        • 每次分枝后,凡是界限超出已知可行解集目标值的那些子集不再进一步分枝,许多子集可不予考虑,这称剪枝。

          • 求解生产进度问题、旅行推销员问题、工厂选址问题、背包问题及分配问题等。
        • 用分枝定界法求解整数规划(最大化)问题的步骤为:

          • 将要求解的整数规划问题称为问题 A ,将与它相应的线性规划问题称为问题 B
          • 解问题 B 可能得到以下情况之一:

            • B 没有可行解,这时 A 也没有可行解,则停止.
            • B 有最优解,并符合问题 A 的整数条件, B 的最优解即为 A 的最优解,则停止。
            • B 有最优解,但不符合问题 A 的整数条件,记它的目标函数值为 z(UP) 。
          • 用观察法找问题 A 的一个整数可行解,一般可取 x(j) = 0, j = 1,…,n ,试探,求得其目标函数值,并记作 z(down)。以 z* 表示问题 A 的最优目标函数值;这时有z(up)z* ≤ *z(down)*进行迭代。

            • 第一步:分枝
            • 第二步:每个后继问题为一分枝标明求解的结果,与其它问题的解的结果中,找出最优目标函数值最大者作为新的上界 z(up) 。从已符合整数条件的各分支中,找出目标函数值为最大者作为新的下界 z(down) ,若无作用 z(down) 不变。
            • 第三步:比较与剪枝,各分枝的最优目标函数中若有小于 z(down) 者,则剪掉这枝,即以后不再考虑了.若大于 z(down) ,且不符合整数条件,则重复第一步骤。一直到最后得到z* = z(down) 为止。得最优整数解 x(j) , j = 1,…, n
      • 割平面法—可求纯或混合整数线性规划。

      • 隐枚举法—求解“0-1”整数规划

        • 过滤隐枚举法;
        • 分枝隐枚举法。
      • 匈牙利法—解决指派问题(“0-1”规划特殊情形)

        • 匈牙利算法主要用于解决一些与二分图匹配有关的问题
          • 二分图Bipartite graph)是一类特殊的,它可以被划分为两个部分,每个部分内的点互不相连。
          • [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-4G1QCaSM-1633779106926)(C:/Users/23105/AppData/Roaming/Typora/typora-user-images/image-20211009160212023.png)]
          • 匈牙利算法主要用来解决两个问题:求二分图的最大匹配数最小点覆盖数
            • 一个二分图中的最大匹配数等于这个图中的最小点覆盖数。
      • 蒙特卡洛法—求解各种类型规划

        • 蒙特卡罗方法是一种计算方法。原理是通过大量随机样本,去了解一个系统,进而得到所要计算的值。
        • 以概率统计理论为指导的数值计算方法。是指使用随机数(或更常见的伪随机数)来解决很多计算问题的方法。

非线性规划

  • 如果目标函数或约束条件中包含非线性函数,就称这种规划问题为非线性规划问题。

  • 如果线性规划的最优解存在,其最优解只能在其可行域的边界上达到(特别是可行域的顶点上达到);而非线性规划的最优解(如果最优解存在)则可能在其可行域的任意一点达到。

  • 由于线性规划的目标函数为线性函数,可行域为凸集,因而求出的最优解就是整个可行域上的全局最优解。非线性规划却不然,有时求出的某个解虽是一部分可行域上的极值点,但却并不一定是整个可行域上的全局最优解

  • 对于一个实际问题,在把它归结成非线性规划问题时,一般要注意如下几点:

    • 确定供选方案:首先要收集同问题有关的资料和数据,在全面熟悉问题的基础上,确认什么是问题的可供选择的方案,并用一组变量来表示它们。
    • 提出追求目标:经过资料分析,根据实际需要和可能,提出要追求极小化或极大化的目标。并且,运用各种科学和技术原理,把它表示成数学关系式。
    • 给出价值标准:在提出要追求的目标之后,要确立所考虑目标的“好”或“坏”的价值标准,并用某种数量形式来描述它。
    • 寻求限制条件:由于所追求的目标一般都要在一定的条件下取得极小化或极大化效果,因此还需要寻找出问题的所有限制条件,这些条件通常用变量之间的一些不等式或等式来表示。
  • 凸集

    • 在凸组合下闭合的仿射空间的子集。在欧氏空间中,凸集是对于集合内的每一对点,连接该对点的直线段上的每个点也在该集合内。
    • 令X是线性空间。如果对于X的子集S中的所有x和y,并且在区间[0,1]中的所有t,点(1-t)x+ty 也属于S,则S称为凸集
    • 凸集的边界总是凸曲线。
    • 凸最小化是一个优化的子领域,研究了凸函数在凸集上的最小化问题。 用于凸集和凸函数属性研究的数学分支称为凸分析。
    • 性质
      • [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-xz9qcUh7-1633779106929)(C:/Users/23105/AppData/Roaming/Typora/typora-user-images/image-20211009162639341.png)]
    • 凸包:矢量空间的每个子集A包含在最小的凸集(称为A的凸包)中,即包含A的所有凸集的交集。
  • 凸组合

    • 凸组合是一类特殊的线性组合,是若干个点的某种特定意义下的非负线性组合。
    • 设向量{x(i)},i=1,2…,n,如有实数λ(i)>=0 ,且λ(1)+…+λ(n)=1 ,则称λ(1)x(1)+…+λ(n)x(n)为向量{x(i)} 的一个凸组合(凸线性组合)
  • 凸函数

    • f (x) 为定义在 n 维欧氏空间 E(n) 中某个凸集 R 上的函数,若对任何实数α(0 <α <1) 以及 R 中的任意两点 x(1) 和 x(2) ,恒有f (αx(1) + (1−α)x(2) ) ≤αf (x(1) ) + (1−α) f (x(2) )则称 f (x)为定义在 R 上的凸函数。
    • 若对每一个α(0 <α <1) 和 x(1) ≠ x(2) ∈R 恒有f (αx(1) + (1−α)x(2) ) <αf (x(1) ) + (1−α) f (x(2) )则称 f (x)为定义在 R 上的严格凸函数
  • 凸规划

    • 假定其中 f (x)为凸函数,g(j)(x)( j =1,2,…,l) 为凸函数,这样的非线性规划称为凸规划。
    • 凸规划的可行域为凸集,其局部最优解即为全局最优解,而且其最优解的集合形成一个凸集。
    • 当凸规划的目标函数 f (x)为严格凸函数时,其最优解必定唯一(假定最优解存在)
    • 凸规划是一类比较简单而又具有重要理论意义的非线性规划
  • 一维搜索的方法

    • 试探法(“成功—失败”,斐波那契法,0.618 法等)
    • 插值法(抛物线插值法,三次插值法等)
    • 微积分中的求根法(切线法,二分法等)。
  • 二次插值法:

    • 它的基本思想是:在搜索区间中,不断用低次(通常不超过三次)多项式来近似目标函数,并逐步用插值多项式的极小点来逼近最优解。
  • 解析法

    • 梯度法(最速下降法)
      • x*(k* +1) = x**k + t(k) p**k ,每一轮从点 x**k 出发沿最速下降方向 − ∇f (x**k ) 作一维搜索,来建立求解无约束极值问题的方法,称之为最速下降法。
      • 微积分的知识告诉我们,点 x**k 的负梯度方向p**k = −∇f (x**k ) ,是从点 x**k 出发使 f 下降最快的方向。
      • 称负梯度方向 − ∇f (x**k ) 为 f 在点 x**k 处的最速下降方向。
    • Newton 法
    • 变尺度法
      • 它不仅是求解无约束极值问题非常有效的算法,而且也已被推广用来求解约束极值问题。
      • 它既避免了计算二阶导数矩阵及其求逆过程,又比梯度法的收敛速度快,特别是对高维问题具有显著的优越性
  • 在 Matlab 工具箱中,用于求解无约束极值问题的函数有 fminunc 和 fminsearch

  • 约束极值问题

    • 带有约束条件的极值问题称为约束极值问题,也叫规划问题。
    • 二次规划
      • 某非线性规划的目标函数为自变量 x 的二次函数,约束条件又全是线性的,就称这种规划为二次规划。
      • [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-nllYVpm9-1633779106931)(C:/Users/23105/AppData/Roaming/Typora/typora-user-images/image-20211009172647008.png)]
      • 这里 H 是实对称矩阵, f ,b 是列向量, A 是相应维数的矩阵。
      • Matlab 中求解二次规划的命令是[X,FVAL]= QUADPROG(H,f,A,b,Aeq,beq,LB,UB,X0,OPTIONS)
        • 返回值 X 是决策向量 x 的值,返回值 FVAL 是目标函数在 x 处的值。
    • 罚函数法
      • 利用罚函数法,可将非线性规划问题的求解,转化为求解一系列无约束极值问题,因而也称这种方法为序列无约束最小化技术,简记为 SUMT (Sequential Unconstrained Minization Technique)。
      • 罚函数法求解非线性规划问题的思想是,利用问题中的约束函数作出适当的罚函数,由此构造出带参数的增广目标函数,把问题转化为无约束非线性规划问题
  • 在 Matlab 优化工具箱中,用于求解约束最优化问题的函数有:fminbnd、fmincon、quadprog、fseminf、fminimax

    • fminbnd 函数:求单变量非线性函数在区间上的极小值

动态规划

  • 动态规划(dynamic programming)是运筹学的一个分支,是求解决策过程(decision process)最优化的数学方法。

  • 最优性原理(principle of optimality),把多阶段过程转化为一系列单阶段问题,逐个求解,创立了解决这类过程优化问题的新方法—动态规划。

  • 多阶段决策过程最优化问题的动态规划模型通常包含以下要素

    • 阶段:通常根据时间顺序或空间顺序特征来划分阶段,以便按阶段的次序解优化问题。
    • 状态
      • 状态(state)表示每个阶段开始时过程所处的自然状况
      • 它应能描述过程的特征并且无后效性,即当某阶段的状态变量给定时,这个阶段以后过程的演变与该阶段以前各阶段的状态无关
      • 通常还要求状态是直接或间接可以观测的。
      • 根据过程演变的具体情况,状态变量可以是离散的或连续的。
      • 为了计算的方便有时将连续变量离散化;为了分析的方便有时又将离散变量视为连续的。
    • 决策:当一个阶段的状态确定后,可以作出各种选择从而演变到下一阶段的某个状态,这种选择手段称为决(decision),在最优控制问题中也称为控制(control)。
    • 策略:决策组成的序列称为策略(policy)。
    • 状态转移方程:在确定性过程中,一旦某阶段的状态和决策为已知,下阶段的状态便完全确定。用状态转移方程(equation of state transition)表示这种演变规律
    • 指标函数和最优值函数
      • 指标函数(objective function)是衡量过程优劣的数量指标,它是定义在全过程和所有后部子过程上的数量函数,
      • x(k) 给定时指标函数V(k ,n)p(kn) 的最优值称为最优值函数(optimal value function)
    • 最优策略和最优轨线
    • 递归方程
      • 动态规划递归方程是动态规划的最优性原理的基础,即:最优策略的子策略,构成最优子策略
  • 建立起动态规划的数学模型:

    1. 将过程划分成恰当的阶段。
    2. 正确选择状态变量 x(k) ,使它既能描述过程的状态,又满足无后效性,同时确定允许状态集合 X(k)
    3. 选择决策变量u(k) ,确定允许决策集合U(k) (x(k) ) 。
    4. 写出状态转移方程。
    5. 确定阶段指标v(k) (x(k) ,u(k) ) 及指标函数V(kn) 的形式(阶段指标之和,阶段指标之积,阶段指标之极大或极小等)。
    6. 写出基本方程即最优值函数满足的递归方程,以及端点条件。
  • 动态规划与静态规划的关系

    • 动态规划与静态规划(线性和非线性规划等)研究的对象本质上都是在若干约束条件下的函数极值问题。

    • 静态规划只要适当引入阶段变量、状态、决策等就可以用动态规划方法求解。

    • 动态规划可以看作求决策u1 ,u2 ,…,un 使指标函数V1n (x1,u1,u2 ,…,u**n ) 达到最优(最大或最小)的极值问题,状态转移方程、端点条件以及允许状态集、允许决策集等是约束条件,原则上可以用非线性规划方法求解。

    • 与静态规划相比,动态规划的优越性在于:

      • 能够得到全局最优解。由于约束条件确定的约束集合往往很复杂,即使指标函数较简单,用非线性规划方法也很难求出全局最优解。
      • 可以得到一族最优解。与非线性规划只能得到全过程的一个最优解不同,动态规划得到的是全过程及所有后部子过程的各个状态的一族最优解。当最优策略由于某些原因不能实现时,这样的解族可以用来寻找次优策略。
      • 能够利用经验提高求解效率。由于动态规划方法反映了过程逐段演变的前后联系和动态特征,在计算中可以利用实际知识和经验提高求解效率。
    • 动态规划的主要缺点是:

      • 没有统一的标准模型,也没有构造模型的通用方法,甚至还没有判断一个问题能否构造动态规划模型的准则。对于较复杂的问题在选择状态、决策、确定状态转移规律等方面需要丰富的想象力和灵活的技巧性,这就带来了应用上的局限性。
      • 用数值方法求解时存在维数灾(curse of dimensionality)。若一维状态变量有m个取值,那么对于n 维问题,状态 x(k) 就有 m**n 个值,对于每个状态值都要计算、存储函数 f (k) (x(k) ) ,对于n 稍大的实际问题的计算往往是不现实的。
  • 典型问题的动态规划模型:

    • 最短路线问题
    • 生产计划问题
    • 资源分配问题

应用上的局限性。
> - 用数值方法求解时存在维数灾(curse of dimensionality)。若一维状态变量有m个取值,那么对于n 维问题,状态 x(k) 就有 m**n 个值,对于每个状态值都要计算、存储函数 f (k) (x(k) ) ,对于n 稍大的实际问题的计算往往是不现实的。

  • 典型问题的动态规划模型:

    • 最短路线问题
    • 生产计划问题
    • 资源分配问题

你可能感兴趣的:(算法笔记,动态规划,算法)