(邹博ML)凸优化

目录

  • 凸集的基本概念
  • 凸函数的基本概念
  • 凸优化的一般提法

凸集基本概念

思考两个不能式

两个正数的算术平均数大于等于几何平均数 (邹博ML)凸优化_第1张图片 给定可逆对称阵Q,对于任意向量x,y,有: (邹博ML)凸优化_第2张图片

思考凸集和凸函数

在机器学习中,我们把形如 (邹博ML)凸优化_第3张图片(邹博ML)凸优化_第4张图片 这样的图形的都称为凸函数。

  • $y=x^2$是凸函数,函数图像上位于$y=x^2$的区域构成凸集。
    • 凸函数图像的上方区域,一定是凸集;
    • 一个函数图像的上方区域为凸集,则该函数是凸函数。

直线的向量表达

已知二维平面上的两定点A(5,1),B(2,3)尝试给出经过带你AB的直线方程: (邹博ML)凸优化_第5张图片 写成向量形式: 截屏2020-03-03下午2.21.11 其中:(邹博ML)凸优化_第6张图片

几何体的向量表达

已知二维平面上的两个定点截屏2020-03-03下午2.38.54,则: (邹博ML)凸优化_第7张图片 推广到高维: (邹博ML)凸优化_第8张图片

仿射集(Affine set)

定义:通过集合C中任意两个不同点的直线仍然在集合C内,则称集合C为仿射集。 截屏2020-03-03下午2.42.37 仿射集的例子:直线、平面、超平面 超平面:$Ax=b$ f(x)=0表示定义域在$R^n$的超曲面:令$f(x)=Ax-b$,则$f(x)=0$表示截距为b的超平面。 n维空间的n-1维仿射集为n-1维超平面

凸集

集合C内任意两点间的线段均在集合C内,则称集合C维凸集。

注意和仿射集区分

截屏2020-03-03下午2.53.36 仿射集是凸集的一种特殊形式,仿射集一定是凸集。 k个点的版本: 截屏2020-03-03下午2.55.46 (邹博ML)凸优化_第9张图片

凸包

集合C的所有点的凸组合所形成的集合,叫做集合C的凸包: (邹博ML)凸优化_第10张图片 集合C的凸包是能够包含C的最小凸集。 (邹博ML)凸优化_第11张图片

超平面和半空间

超平面:hyperplane 半空间:halfspace (邹博ML)凸优化_第12张图片

欧式球和椭球

欧式球 (邹博ML)凸优化_第13张图片 椭球 (邹博ML)凸优化_第14张图片

范数球和范数锥(欧式空间推广)

(邹博ML)凸优化_第15张图片

$R^3$空间中的二阶锥

(邹博ML)凸优化_第16张图片

多面体

有限个半空间和超平面的交集。 (邹博ML)凸优化_第17张图片 仿射集(如超平面、直线)、射线、线段、半空间都是多面体 多面体是凸集 此外,有界的多面体有时称作多胞体(Polytope) (邹博ML)凸优化_第18张图片

保持凸性运算

  • 集合交运算
  • 仿射变换
  • 透视变换
  • 投射变换(线性分式变换)

集合交运算:半空间的交 (邹博ML)凸优化_第19张图片 仿射变换 (邹博ML)凸优化_第20张图片 透视变换 (邹博ML)凸优化_第21张图片 投射函数(线性分式函数) (邹博ML)凸优化_第22张图片

分割超平面

设C和D为两不相交的凸集,则存在超平面P,P可以将C和D分离。 截屏2020-03-03下午3.44.48 (邹博ML)凸优化_第23张图片 分割超平面的构造: (邹博ML)凸优化_第24张图片

支撑超平面

设集合C,x0是C边界上的点,若存在$a\not=0$。满足对任意$x\in C$,都有截屏2020-03-03下午3.48.41成立,则称超平面截屏2020-03-03下午3.49.23为集合C在点x0处的支撑超平面。 凸集边界上任意一点,均存在支撑超平面。 反之,若一个闭的非中空集合,在边界上任意一点存在支撑超平面,则该集合为凸集。

凸函数

若函数f的定义域domf为凸集,且满足: (邹博ML)凸优化_第25张图片

一阶可微

若f一阶可微,则函数f为凸函数,当且仅当f的定义域domf为凸集,且: (邹博ML)凸优化_第26张图片 分析截屏2020-03-03下午3.55.57 对于凸函数,其一阶Taylor近似本质上是该函数的全局下估计。 反之如果一个函数的一阶Taylor近似总是其全局下估计,则该函数是凸函数 该不等式说明从一个函数的局部信息,可以得到一定车程度的全局信息。

二阶可微

若函数f二阶可微,则函数f为凸函数当且进档dom为凸集,且: (邹博ML)凸优化_第27张图片 若f为一元函数,上式表示二阶导大于等于0 若f是多元函数,上式表示二阶导Hessian矩阵半正定。 凸函数举例:

上镜图

函数f的图像定义为:截屏2020-03-03下午4.05.48 函数f的上镜图(epigraph)定义为 (邹博ML)凸优化_第28张图片

Jensen不等式:若f是凸函数

基本Jensen不等式 截屏2020-03-03下午4.31.59 若: 截屏2020-03-03下午4.32.21 则: 截屏2020-03-03下午4.32.45 若: 截屏2020-03-03下午4.33.07 则: 截屏2020-03-03下午4.33.26 Jensen不等式是几乎所有不等式的基础

保持函数凸性的算子

(邹博ML)凸优化_第29张图片

凸函数的逐点最大值

若$f_1,f_2$均为凸函数,定义函数$f$: 截屏2020-03-03下午4.37.43 则函数$f$为凸函数。 证明: (邹博ML)凸优化_第30张图片 第二个不等号的表达: (邹博ML)凸优化_第31张图片 第二个不等好的形式化表达: (邹博ML)凸优化_第32张图片

共轭函数

原函数截屏2020-03-03下午4.39.46,共轭函数定义: (邹博ML)凸优化_第33张图片 显然,定义式的右端是关于y的仿射函数,他们逐点求上确界,得到的函数f*(y)一定是凸函数。 理解: (邹博ML)凸优化_第34张图片 例: 求共轭函数截屏2020-03-03下午4.42.09 (邹博ML)凸优化_第35张图片

Fenchel不等式

根据共轭函数定义: (邹博ML)凸优化_第36张图片 易得: 截屏2020-03-03下午4.43.48 应用: (邹博ML)凸优化_第37张图片

凸优化

凸优化问题的基本形式:

(邹博ML)凸优化_第38张图片

  • 优化变量:$x \in R^n$

  • 不等式约束:$f_i(x)\le0$

  • 等式约束:$h_j(x)=0$

  • 无约束优化:$m=p=0$

  • 优化问题的域: (邹博ML)凸优化_第39张图片

  • 可行点(解)(feasible) 截屏2020-03-03下午4.51.22

  • 可行域(可解集) 所有可行点的集合。

  • 最优化值 截屏2020-03-03下午4.52.11

  • 最优化解 截屏2020-03-03下午4.52.31

对于 (邹博ML)凸优化_第40张图片 其中 $f_i(x)$为凸函数,$h_j(x)$为仿射函数 凸优化问题的重要性质:

  • 凸优化问题的可行域为凸集
  • 凸优化问题的局部最优解就是全局最优解

对偶问题

一般优化问题的Lagrange乘子法 Lagrange函数:(邹博ML)凸优化_第41张图片 对于固定的x,Lagrange函数$L(x,\lambda,v)$是关于$\lambda$和v的仿射函数。

Lagrange对偶函数

Langrange对偶函数: 截屏2020-03-03下午5.05.08 若没有下确界,定义: 截屏2020-03-03下午5.06.41 根据定义,显然有:对截屏2020-03-03下午5.07.21,若原优化问题有最优值P*,则: 截屏2020-03-03下午5.08.01 进一步:Lagrange函数对偶函数为凹函数。 (邹博ML)凸优化_第42张图片

鞍点解释

(邹博ML)凸优化_第43张图片 截屏2020-03-03下午5.10.19 鞍点:最优点 (邹博ML)凸优化_第44张图片

强对偶条件

若要对偶函数的最大值即为原问题的最小值,需要满足的条件: (邹博ML)凸优化_第45张图片

Karush-Kuhn-Tucker(KKT)条件

(邹博ML)凸优化_第46张图片

你可能感兴趣的:((邹博ML)凸优化)