凸集和凸优化

凸集和凸优化

  • 一、 凸集
    • 1. 凸集与仿射集的关系
    • 2. 凸集相关概念
  • 二、凸函数
    • 1. 定义
    • 2. 性质
    • 3. 凸函数举例
    • 4. 海森矩阵
      • 4.1 海森矩阵(Hession)和极值的关系
    • 5. 泰勒展开式
      • 5.1 定理
      • 5.2 二元泰勒展开
      • 5.3 多元泰勒展开
  • 三、凸优化
    • 1. 凸优化问题的基本形式
    • 2. 借助拉格朗日函数做优化

一、 凸集

1. 凸集与仿射集的关系

  • 说道凸集,就不得不提到仿射集的概念。
  • 仿射集:
    • 通过集合C中任意两个不同点的直线仍在集合C内,则称集合C为仿射集(例如直线和平面)。
      凸集和凸优化_第1张图片
    • 设X1和X2是定义在集合C中任意两个不同的点,即X1 ≠ X2,并且 X1,X2 ∈ C,θ⊆R,对θ都有θX1 + (1-θ)X2 ∈ C,则称C为一个仿射集。
    • 若对上面定义增加一个条件0 ≤ θ ≤1,则C为一个凸集。
    • 因为仿射集的条件比凸集的条件强,因此仿射集必然是凸集。

2. 凸集相关概念

  • 保凸运算:
    1.凸集与凸集的交集还是凸集;
    2.仿射变换,即线性变换;
    3.透视变换;
    4.投射变换。
  • 保凸算子:
    • 凸函数的非负加权和
    • 凸函数和仿射函数的复合
    • 凸函数的逐点最大值,逐点上确界
      f(x) = max( f1(x),f2(x),fk(x)…fn(x) )
      f(x) = sup g(x,y)

二、凸函数

1. 定义

  • 若一个函数满足:
    1.定义域是凸集
    2.f(ax1 + (1-a)x2) <= af(x1) + (1-a)f(x2)  其中:∑a1=1,a1 >= 0   那么该函数为凸函数。
    示例: f ( x 1 + x 2 2 ) ≤ f ( x 1 ) + f ( x 2 ) 2 f(\frac {x_1+x_2}{2})≤\frac {f(x_1)+f(x_2)}{2} f(2x1+x2)2f(x1)+f(x2)
    凸集和凸优化_第2张图片

2. 性质

  • 凸函数的局部极小值就是全局最小值
  • 凸函数Hessian矩阵半正定
  • Q为半正定对称阵,f(x) = xTQx为凸函数
  • f(x)为凸函数,f(E(x)) <= E(f(x))   (Jesson不等式)其中E(x)是x的期望
    Hessian矩阵半正定
    • 特征值:向量变换的大小;

3. 凸函数举例

  • 指数函数f(x) = ex
  • 幂函数f(x) = xa
  • 负对数函数f(x) = -logx
  • 负熵函数f(x) = xlnx
  • 范数f(x) = ||x||
  • 最大值函数f(x) = max(x1,x2,…,xn)

4. 海森矩阵

4.1 海森矩阵(Hession)和极值的关系

  • 可导函数在某一点处取得极值的必要条件是梯度为0,梯度为0的点成为函数的驻点这是疑似极值点。需要注意的是,梯度为0只是函数取极值的必要条件而不是充分条件,即梯度为0的点可能不是极值。
    如果Hession矩阵正定(所有特征值为正数),函数有极小值;
    如果Hession矩阵负定(所有特征值为负数数),函数有极小值;
    如果Hession矩阵不定(所有特征值为有正有负),则不是极值点(鞍点)。

5. 泰勒展开式

5.1 定理

  • 设n是一个正整数,如果定义在一个包含a的区间上的函数f在a点处n+1次可导,那么对于这个区间上的任意x,都有:
    f ( x ) = f ( a ) + f ′ ( a ) 1 ! ( x − a ) + f ( 2 ) ( a ) 2 ! ( x − a ) 2 + . . . + f ( n ) ( a ) n ! ( x − a ) n + R n ( x ) f(x) = f(a)+\frac {f\prime(a)}{1!}(x-a)+\frac {f^{(2)}(a)}{2!}(x-a)^2+...+\frac {f^{(n)}(a)}{n!}(x-a)^n+R_n(x) f(x)=f(a)+1f(a)(xa)+2f(2)(a)(xa)2+...+nf(n)(a)(xa)n+Rn(x)
  • 其中多项式称为函数在a处的泰勒展开式,剩余的Rn(x)是泰勒公式的余项,是(x-a)n的高阶无穷小。

5.2 二元泰勒展开

凸集和凸优化_第3张图片
f ( x ) = f ( x 0 ) + ▽ f ( x 0 ) T △ x + 1 2 △ x T G ( x 0 ) △ x + . . . f(x)=f(x_0)+\triangledown f(x_0)^T\triangle x+\frac {1}{2} \triangle x^TG(x_0)\triangle x+... f(x)=f(x0)+f(x0)Tx+21xTG(x0)x+...

5.3 多元泰勒展开

凸集和凸优化_第4张图片

三、凸优化

1. 凸优化问题的基本形式

  • miniminze        f0(x),x ∈ Rn
    subject  to        fi(x) ≤ 0,i = 1,…,m
                            hj(x) = 0,j = 1,…,n
  • 其中fi(x)为凸函数,hj(x)为仿射函数
  • 凸优化问题的可行域为凸集,凸优化问题的局部最优解即为全局最优解。

2. 借助拉格朗日函数做优化

  • Lagrange函数:
    L ( x , λ , ν ) = f 0 ( x ) + ∑ i = 1 m λ i f i ( x ) + ∑ j = 1 n ν j h j ( x ) L(x,\lambda,\nu)=f_0(x)+\displaystyle\sum_{i=1}^m \lambda _if_i(x)+\displaystyle\sum_{j=1}^n \nu_j h_j(x) L(x,λ,ν)=f0(x)+i=1mλifi(x)+j=1nνjhj(x)
  • Lagrange对偶函数:
    g ( λ , ν ) = i n f ( L ( x , λ , ν ) ) = i n f [ f 0 ( x ) + ∑ i = 1 m λ i f i ( x ) + ∑ j = 1 n ν j h j ( x ) ] g(\lambda,\nu)=inf(L(x,\lambda,\nu))=inf[f_0(x)+\displaystyle\sum_{i=1}^m \lambda _if_i(x)+\displaystyle\sum_{j=1}^n \nu_j h_j(x)] g(λ,ν)=inf(L(x,λ,ν))=inf[f0(x)+i=1mλifi(x)+j=1nνjhj(x)]

你可能感兴趣的:(凸集和凸优化)