【课程复习+记录】最优化理论与方法

文章目录

    • 1 最优化问题与数学基础
    • 2 线性规划和单纯形法
      • 2.1 数学模型形式
      • 2.2 基本概念名词
      • 2.3 解的性质
      • 2.4 单纯形法
      • 2.5 初始基可行解的确定方法
        • 2.5.1 两阶段方法
        • 2.5.2 大M法
    • 3 对偶线性规划
    • 4 无约束最优化计算方法
      • 4.1 下降迭代算法
        • 4.1.1 一般格式
        • 4.1.2 一维搜索
        • 4.1.3 收敛速度
      • 4.2 精确一维搜索
        • 4.2.1 黄金分割法
        • 4.2.2 Fibonacci法
        • 4.2.3 三点二次插值法
      • 4.3 最速下降法
      • 4.4 牛顿法
      • 4.5 共轭方向法
        • 4.5.1 FR共轭梯度法
      • 4.6 信赖域方法(限步长方法)
    • 5 约束最优化方法
      • 5.1 最优性条件
        • 5.1.1 可行下降方向相关概念
        • 5.1.2 一阶必要条件(已知局部极小点且正则点)
        • 5.1.3 二阶充分条件(判断严格局部最小点)
          • 利用KT点求解最优解
      • 5.2 惩罚函数
      • 5.3 外点惩罚函数
      • 5.4 内点惩罚函数
      • 5.5 乘子法
      • 5.6 Rosen梯度投影法
    • 总结感想

1 最优化问题与数学基础

  1. 数学模型的一般形式:

    【课程复习+记录】最优化理论与方法_第1张图片

    向量形式:(一般情况下,默认列向量

    【课程复习+记录】最优化理论与方法_第2张图片

  2. 目标函数是连续的单值函数的等值线性质:

    【课程复习+记录】最优化理论与方法_第3张图片

    【课程复习+记录】最优化理论与方法_第4张图片

  3. 可微:

    • 判断函数在点处可微,默认2范数

    【课程复习+记录】最优化理论与方法_第5张图片

    image-20211225223248247

    • 若可微,一阶偏导存在

      【课程复习+记录】最优化理论与方法_第6张图片

  4. 梯度

    计算:

    image-20211225223441388

    相关性质:

    image-20211225223526215

    • 梯度方向是增长最快的方向

    常用的梯度函数:

    【课程复习+记录】最优化理论与方法_第7张图片

  5. 方向导数:函数沿指定方向的变化率

    • 假设||P||=1

    【课程复习+记录】最优化理论与方法_第8张图片

    ​ 做题时使用方向向量时注意化成单位向量

    • 方向讨论

      【课程复习+记录】最优化理论与方法_第9张图片

  6. Jacobi矩阵

    【课程复习+记录】最优化理论与方法_第10张图片

  7. Hesse矩阵

    【课程复习+记录】最优化理论与方法_第11张图片

    常用计算:

    【课程复习+记录】最优化理论与方法_第12张图片

  8. 最优性条件

    • 驻点:一阶偏导为0

    • 一阶必要条件:若是局部极小点,则一阶偏导为0

    • 二阶必要条件:若是局部极小点,则Hesse矩阵半正定

    • 二阶充分条件:是驻点且Hesse矩阵正定,则为严格局部极小点

  9. 凸集

    判断凸集:任意有限个点的凸组合仍在D中

    【课程复习+记录】最优化理论与方法_第13张图片

  10. 凸函数

    • 几何上看:弦在弧上

    • 题目:判断凸函数?

      • 定义

        image-20211225232241837

      • 利用凸组合形式(充要条件)

        【课程复习+记录】最优化理论与方法_第14张图片

      • 引入梯度(充要条件)

        image-20211225232426401

      • Hesse矩阵(充要条件):Hesse矩阵半正定

  11. 凸规划

    • 定义

      【课程复习+记录】最优化理论与方法_第15张图片

    • 性质(第三点很重要)

      【课程复习+记录】最优化理论与方法_第16张图片

      image-20211225233005413

    • 最优解相关

      • 唯一?

        image-20211225233047048

      • 最优解判定(充要条件)对可行集中的任意X

        image-20211225233124621

2 线性规划和单纯形法

2.1 数学模型形式

  1. 一般线性规划形式

    【课程复习+记录】最优化理论与方法_第17张图片

  2. 标准形式

    【课程复习+记录】最优化理论与方法_第18张图片

    矩阵形式:

    image-20211225233933476

    另一种形式:

    image-20211225234608459

    【课程复习+记录】最优化理论与方法_第19张图片

  3. 转化为标准形式

    【课程复习+记录】最优化理论与方法_第20张图片

    如果是 ≤ {\le} 则(+)松弛变量

    如果是 ≥ {\ge} 则(-)剩余变量

    R:两个自由变量相减

2.2 基本概念名词

【课程复习+记录】最优化理论与方法_第21张图片

基、基本解(非基变量全为零)、可行解、基可行解(所有分量非负的基本解)、最优基可行解、最优基

image-20211225235019700

顶点、极点

2.3 解的性质

  1. 判断可行解是基可行解

    【课程复习+记录】最优化理论与方法_第22张图片

  2. 可行解是顶点

    image-20211226131601566

  3. 若线性规划有最优解,则必在其可行集S的顶点处取得

2.4 单纯形法

  1. 基本思想

    从线性规划的某一个顶点出发,沿着使目标函数值下降的方向寻找下一个顶点

    即,从顶点到顶点

  2. 最优解判别准则

    image-20211226132457871

    • 写成分量形式:

    【课程复习+记录】最优化理论与方法_第23张图片

    image-20211226132734802

    实际上只要验证非基变量所对应的判别数

    • 无解情况:

    image-20211226133405973

    • 最优解形式:设A是行满秩

    【课程复习+记录】最优化理论与方法_第24张图片

    【课程复习+记录】最优化理论与方法_第25张图片

  3. 换基运算本质从一个基可行解(顶点)迭代出(转到)另一个基可行解(顶点)

    关键是:主元、进基列、出基列的选择

    • 主元

    image-20211226161714732

    【课程复习+记录】最优化理论与方法_第26张图片

    基变量取相应的b,非基变量全部取0,则得到一个初始的基可行解

    • 进基列的选择(常用2&3)

      【课程复习+记录】最优化理论与方法_第27张图片

  4. 具体的表格绘制

    • 绘制初始单纯形表格

      【课程复习+记录】最优化理论与方法_第28张图片

      注:基变量所对应的判别数为0

    • 进行换基运算,这里的判别数也通过行处理变化进行运算更新

    • 整体运算过程:

      【课程复习+记录】最优化理论与方法_第29张图片

2.5 初始基可行解的确定方法

主要原因:系数矩阵A未必刚好有一个m阶的单位矩阵,因此没有现成的初始基可行解。=》引入人工变量,即构造初始基可行解

2.5.1 两阶段方法

首先,重写一个辅助线性规划:

【课程复习+记录】最优化理论与方法_第30张图片

【课程复习+记录】最优化理论与方法_第31张图片

同时,根据构造的辅助线性规划,可以判断原规划是否有可行解

根据公式:

image-20211226170025054

  1. g*>0:原规划无可行解

  2. g*=0

    • 基变量全在x中,则基可行解是原规划的初始基可行解

    • 基变量不全在x中

      【课程复习+记录】最优化理论与方法_第32张图片

      【课程复习+记录】最优化理论与方法_第33张图片

第一阶段,在得到原规划的初始基可行解时,辅助构造的线性规划表格的最后一行的判别数行不用管

第二阶段,写出原规划对应的表格,进行进一步的计算

2.5.2 大M法

  1. 基本思想

    【课程复习+记录】最优化理论与方法_第34张图片

  2. 最优解分析

    【课程复习+记录】最优化理论与方法_第35张图片

  3. 在改写目标函数时,由于松弛变量也可以当做人工变量看待,所以不用再加一个人工变量,同时,目标函数的M的乘积项中也不用带这个松弛变量。M作为一个值很大的正常数正常运算即可。

  4. 单纯形法的改进中,为了避免循环,对进基列的选择进行了修改:

    image-20211226193307292

    【课程复习+记录】最优化理论与方法_第36张图片

3 对偶线性规划

原线性规划及其对偶线性规划的最优解之间存在着某种联系。

  1. 原规划及其对偶形式(对称形式)

    规划1:

    image-20211226194605015

    规划2:

    【课程复习+记录】最优化理论与方法_第37张图片

  2. 混合形式变换规则表

    【课程复习+记录】最优化理论与方法_第38张图片

  3. 对偶定理

    已知

    image-20211226202525804

    • 弱对偶性

      【课程复习+记录】最优化理论与方法_第39张图片

    • 均有最优解的充要条件:都有可行解

    • 最优性:

      image-20211226202703030

    • 强对偶性:

      image-20211226202722116

    image-20211226202837476

    image-20211226203121644

  4. 对偶线性规划的解之间的关系

    【课程复习+记录】最优化理论与方法_第40张图片

  5. 对偶单纯形法:从一个正则解到另一个正则解,为了解决b<0的情况

    【课程复习+记录】最优化理论与方法_第41张图片

4 无约束最优化计算方法

核心迭代公式:

X k + 1 = X k + t k P k {X^{k+1}=X^k+t_kP^k} Xk+1=Xk+tkPk

算法收敛:

image-20211226205143187

收敛准则即迭代更新差小于给定精度

4.1 下降迭代算法

4.1.1 一般格式

【课程复习+记录】最优化理论与方法_第42张图片

那么,后面的讨论就是确定步长和下降方向的规则

4.1.2 一维搜索

image-20211226205751219

image-20211226205811107

image-20211226205829625

4.1.3 收敛速度

【课程复习+记录】最优化理论与方法_第43张图片

  • 0 < β < 1 {0< \beta <1} 0<β<1 β {\beta} β线性收敛
  • β = 0 {\beta = 0} β=0,超线性收敛
  • β = 1 {\beta = 1} β=1,次线性收敛

【课程复习+记录】最优化理论与方法_第44张图片

4.2 精确一维搜索

4.2.1 黄金分割法

  1. 基本思想

    不断缩小搜索区间且区间的搜索比不变

    【课程复习+记录】最优化理论与方法_第45张图片

    【课程复习+记录】最优化理论与方法_第46张图片

    image-20211226211920381

    image-20211226211940289

  2. 具体缩小

    【课程复习+记录】最优化理论与方法_第47张图片

4.2.2 Fibonacci法

【课程复习+记录】最优化理论与方法_第48张图片

【课程复习+记录】最优化理论与方法_第49张图片

【课程复习+记录】最优化理论与方法_第50张图片

4.2.3 三点二次插值法

【课程复习+记录】最优化理论与方法_第51张图片

image-20211226213235857

收敛性定理:保证算法的下降性,要求每次搜索方向与负梯度方向成锐角

4.3 最速下降法

核心公式:

image-20211226214044880

  1. 基本算法

    【课程复习+记录】最优化理论与方法_第52张图片

  2. 最速下降算法下,搜索呈锯齿状前行

  3. 最优步长的确定:(也可以直接用一维搜索的算法,求导等于0得到)

    【课程复习+记录】最优化理论与方法_第53张图片

  4. k+1次的迭代:

    【课程复习+记录】最优化理论与方法_第54张图片

  5. 最速下降法相邻两次迭代的方向互相垂直

    【课程复习+记录】最优化理论与方法_第55张图片

4.4 牛顿法

  1. 基本思想

    用一个二次函数去近似一个目标函数,然后精确地求出这个二次函数的极小点

    【课程复习+记录】最优化理论与方法_第56张图片

    先写出目标函数某点的Taylor公式二次展开,然后求导等于零,认为Hesse矩阵正定,则求出极小点的新的近似作为下一次的迭代值。

    image-20211227194737814

  2. 牛顿迭代公式

    image-20211226220206587

  3. 具体算法(无需求Hesse矩阵的逆)

    【课程复习+记录】最优化理论与方法_第57张图片

4.5 共轭方向法

  1. 思想,均是执行精确一维搜索

    image-20211226221622390

  2. 共轭概念

    【课程复习+记录】最优化理论与方法_第58张图片

    image-20211226221737395

4.5.1 FR共轭梯度法

通过负梯度来构造共轭向量组,相应的共轭方向法叫共轭梯度法

  1. 具体算法

    【课程复习+记录】最优化理论与方法_第59张图片

    其中 t k {t_k} tk仍是用一维搜索推导得到的。

    image-20211226222632614

4.6 信赖域方法(限步长方法)

信赖域的方法:自适应改变步长上界,并在使得步长上界尽可能大的同时,尽量保持二次模型与目标函数的一致程度。

  1. 模型问题

    【课程复习+记录】最优化理论与方法_第60张图片

    其中, h k {h^k} hk是步长上界,用于定义点 X k {X^k} Xk的邻域:

    image-20211227195732846

  2. 步长上界 h k {h^k} hk的选择定义

    • 第k步的实际下降量

      image-20211227195847291

    • 第k步的预测下降量

      image-20211227195914306

    • 上面两者的比值衡量二次模型近似目标函数的程度:

      image-20211227195957082

    评价:

    image-20211227200316891

  3. 具体算法

    【课程复习+记录】最优化理论与方法_第61张图片

5 约束最优化方法

约束最优化问题模型:

【课程复习+记录】最优化理论与方法_第62张图片

【课程复习+记录】最优化理论与方法_第63张图片

image-20211227204116291

5.1 最优性条件

5.1.1 可行下降方向相关概念

  1. 可行域:满足约束条件的点所构成的集合
  2. 可行方向:从可行域中的一个点出发,如果在一个非零向量P上存在一定步长使得线段上的点都在可行域内,这个非零向量P就是可行方向
  3. 下降方向:在一定步长范围内,沿着某个非零向量P上走,能使得函数值减小
  4. 可行下降方向:非零向量P既是可行方向又是下降方向

【课程复习+记录】最优化理论与方法_第64张图片

5.1.2 一阶必要条件(已知局部极小点且正则点)

【课程复习+记录】最优化理论与方法_第65张图片

【课程复习+记录】最优化理论与方法_第66张图片

上述五个条件又叫KKT条件,满足这个条件的点就叫KKT(K-T)点

因此,证明KKT点,即是证明存在 λ ∗ & μ ∗ {\lambda^* \& \mu^*} λ&μ满足那五个条件。

5.1.3 二阶充分条件(判断严格局部最小点)

存在 λ ∗ & μ ∗ {\lambda^* \& \mu^*} λ&μ

【课程复习+记录】最优化理论与方法_第67张图片

利用KT点求解最优解
  1. 假设KT点

    image-20211227222052081

  2. 列出等式

    image-20211227222138120

    image-20211227222147772

    【课程复习+记录】最优化理论与方法_第68张图片

  3. 解等式,得到 λ ∗ & μ ∗ {\lambda^* \& \mu^*} λ&μ,反带入等式,解出具体的KT点的值

  4. 此时只能得到局部极小点,若要得到严格局部最小点,则利用二阶充分条件,即判断:

    image-20211227222659355

    或者利用二阶充分条件的定义:

    【课程复习+记录】最优化理论与方法_第69张图片

5.2 惩罚函数

image-20211227223502692

5.3 外点惩罚函数

  1. 构造惩罚函数

    image-20211227232756693

    【课程复习+记录】最优化理论与方法_第70张图片

    image-20211227232827658

  2. 具体算法

    【课程复习+记录】最优化理论与方法_第71张图片

5.4 内点惩罚函数

image-20211229181633592

【课程复习+记录】最优化理论与方法_第72张图片

5.5 乘子法

感觉不会考 有点复杂

5.6 Rosen梯度投影法

  1. 形式

    【课程复习+记录】最优化理论与方法_第73张图片

  2. 下降可行方向的确定(利用投影矩阵)

    • 投影矩阵

      image-20211227225237617

      【课程复习+记录】最优化理论与方法_第74张图片

      image-20211227225327860

      image-20211227225339250

      image-20211227225356700

    • 可行方向(充要条件)

      【课程复习+记录】最优化理论与方法_第75张图片

      image-20211227230351120

      image-20211227230401592

      【课程复习+记录】最优化理论与方法_第76张图片

      【课程复习+记录】最优化理论与方法_第77张图片

      【课程复习+记录】最优化理论与方法_第78张图片

    • 进而判断可行下降方向

      image-20211227225829354

  3. 确定步长上界

    【课程复习+记录】最优化理论与方法_第79张图片

    【课程复习+记录】最优化理论与方法_第80张图片

  4. 具体算法

    image-20211227230543795

    【课程复习+记录】最优化理论与方法_第81张图片

    image-20211227231759670

感觉老师ppt上面讲的流程也不是很清楚,可以参考傅英定的最优化理论与方法的相关内容。

总结感想

  1. 凸函数、凸规划有很多性质,因此在现实中希望把一些问题转为凸优化问题
  2. 任意一个线性规划都能转化为标准形式,因此,可以转向对标准形式的研究
  3. 在基变量等名词理解和公式推导的过程中,让我想起线代中的列向量空间,理解有异曲同工之妙
  4. 单纯形法是一种理想的情况,在有现成的初始基可行解的条件下进行操作,本质就是从一个基可行解到另一个基可行解,目标是为了让目标函数值下降,直至最小
  5. 两阶段方法和大M法则是解决了单纯形法在没有现成的初始基可行解的情况。此时,很容易想到,人为构造辅助的初始基可行解,再利用换基操作,将基变量均换成非辅助变量即可。
  6. 对偶单纯形法:从一个正则解到另一个正则解,为了解决b<0的情况
  7. 无约束条件下的单变量函数最优化问题是解非线性优化问题
  8. 无约束最优化计算方法实际上就是对步长和下降方向的规则的讨论:一维搜索则是对最优步长进行讨论;精确一维搜索则是对搜索区间进行讨论;最速下降法是一维搜索的升级版,即每次都会求解相应的最优步长和下降方向;牛顿法在迭代点附近用二次函数逼近,形式简单,但需要计算Hesse矩阵,计算量大;通过负梯度来构造共轭向量组,相应的共轭方向法叫共轭梯度法;FR共轭梯度法对下降搜索方向做出了改变;信赖域的方法是基于牛顿法的函数近似思想对其进行改进,即在一定步长范围内,近似函数才能逼近,所以要动态调整步长上界。

uestc2021年最优化考试

  1. 分别用外点法和内点法求最优值
  2. 单纯形法,对偶规划,KKT点,所有的可行(下降)方向
  3. FR共轭梯度投影法(除了求解相关问题,并判断它是否是局部最优解,还要分析写出它的特点和缺陷)
  4. Rosen梯度投影,前两问计算很简单,几乎给了所有公式,然后就是按照步骤继续算下去。
  5. 填空题,如果好好复习的话都不难,比如,黄金分割法、两阶段法的有解条件,方向导数等。不过最后考了一个信赖域的题目。

你可能感兴趣的:(数学,矩阵,算法)