凸优化1——仿射集、凸集、锥

仿射集、凸集、锥

  • 概念
    • 1.1 仿射集
      • 关于集合 C C C的子空间
      • 仿射包
      • 常见的仿射集
    • 1.2 凸集
      • 凸包
      • 常见的凸集
    • 1.3 锥
      • 锥包
      • 常见的凸锥
  • 一些例子
    • 2.1 超平面与半空间
    • 2.2 Euclid球和椭球
    • 2.3 多面体polyhedron
    • 2.4半正定锥

概念

设 有 k 个 点 x 1 , x 2 , … , x k ∈ C , C 是 一 个 集 合 , 有 k 个 实 数 θ 1 , θ 2 , … , θ k ∈ R 设有k个点x_1,x_2,\ldots,x_k\in C,C是一个集合,有k个实数\theta_1,\theta_2,\ldots,\theta_k \in R kx1,x2,,xkCCkθ1,θ2,,θkR
对于组合:
θ 1 x 1 + θ 2 x 2 + … + θ k x k \theta_1x_1+\theta_2x_2+\ldots+\theta_kx_k θ1x1+θ2x2++θkxk

  • 称为仿射组合:当满足条件: θ 1 + θ 2 + ⋯ + θ k = 1 \theta_1+\theta_2+\cdots+\theta_k = 1 θ1+θ2++θk=1
  • 称为凸组合:当满足条件: θ 1 + θ 2 + ⋯ + θ k = 1 且 θ i ≥ 0 , i = 1 , 2 , ⋯   , k \theta_1+\theta_2+\cdots+\theta_k = 1 且 \theta_i \ge 0,i=1,2,\cdots,k θ1+θ2++θk=1θi0,i=1,2,,k
  • 称为锥组合:当满足条件: θ i ≥ 0 , i = 1 , 2 , ⋯   , k \theta_i \ge 0,i=1,2,\cdots,k θi0,i=1,2,,k

1.1 仿射集

如果集合 C C C中任意点的仿射组合仍然在集合 C C C中,则集合 C C C是仿射的,称为仿射集

关于集合 C C C的子空间

如果 C 是 一 个 仿 射 集 合 并 且 x 0 ∈ C , 则 集 合 C是一个仿射集合并且x_0\in C,则集合 C仿x0C,
V = C − x 0 = { x − x 0 ∣ x ∈ C } V=C-x_0=\{x-x_0|x\in C\} V=Cx0={xx0xC}
是一个子空间,即关于加法和数乘是封闭的。
仿射集合 C C C可以表示为:
C = V + x 0 = { v + x 0 ∣ v ∈ V } C=V+x_0=\{v+x_0|v\in V\} C=V+x0={v+x0vV}
即一个子空间加上一个偏移。

  • 与仿射集合 C C C相关的子空间 V 与 x 0 V与x_0 Vx0的选取无关,所以 x 0 x_0 x0可以是 C C C中的任意一点。
  • 与仿射集合 C C C相关的子空间 V V V一定是过零点的,因为 x 0 ∈ C x_0\in C x0C,对于 C C C中所有 x x x都执行 x − x 0 x-x_0 xx0,那么点 x 0 x_0 x0也会执行 x 0 − x 0 x_0-x_0 x0x0,所以子空间必然会过零点。

仿射包

包含集合 C C C中所有点的仿射组合的集合称为仿射包,记为 a f f C \mathbf{aff}C affC:
a f f C = { θ 1 x 1 + ⋯ + θ k x k ∣ x 1 , ⋯   , x k ∈ C , θ 1 + ⋯ + θ k = 1 } \mathbf{aff}C=\{\theta_1x_1+\cdots+\theta_kx_k|x_1,\cdots,x_k\in C, \theta_1+\cdots+\theta_k=1\} affC={θ1x1++θkxkx1,,xkC,θ1++θk=1}

常见的仿射集

  • 线性方程组的解集
    C = { x ∣ A x = b } C=\{x|Ax=b\} C={xAx=b},与仿射集合 C C C相关联的子空间就是 A A A的零空间。反之,任意仿射集合可以表示为一个线性方程组的解集
  • 空集 ∅ \emptyset 、点、直线、平面都是仿射的

1.2 凸集

如果集合 C C C中任意点的凸组合仍在 C C C中,则集合 C C C凸集
由于仿射集包含穿过集合中任意不同点的整条直线,任意不同两点间的线段自然也在集合中,所以仿射集是凸集

  • 点的凸组合可以看做它们的混合加权平均
  • 粗略地,凸集中的每一个点都可以被其他点沿着它们之间一条无阻碍的路径看见

凸包

包含集合 C C C中所有点的凸组合的集合称为凸包,记为 c o n v C \mathbf{conv} C convC,凸包是包含集合 C C C的最小凸集。
c o n v C = { θ 1 x 1 + ⋯ + θ k x k ∣ x i ∈ C , θ i ≥ 0 , i = 1 , ⋯   , k , θ 1 + ⋯ + θ k = 1 } \mathbf{conv}C=\{\theta_1x_1+\cdots+\theta_kx_k|x_i\in C, \theta_i\ge 0,i=1,\cdots,k,\theta_1+\cdots+\theta_k=1\} convC={θ1x1++θkxkxiC,θi0,i=1,,k,θ1++θk=1}

常见的凸集

  • 空集 ∅ \emptyset 、点、线段、多边形

1.3 锥

如果对于任意 x ∈ C 和 θ ≥ 0 都 有 θ x ∈ C x\in C和\theta \ge 0 都有\theta x \in C xCθ0θxC,我们称集合 C C C或者非负齐次。如果集合 C C C是锥,且是凸的,则称为凸锥
也就是说所有集合 C C C中任意点的锥组合都在集合 C C C中,则集合 C C C凸锥

  • 锥都是过零点的(因为 θ \theta θ可以等于0)。
  • 从零点出发的射线是锥
  • 凸锥都是凸集

锥包

包含集合 C C C中所有点的锥组合的集合称为锥包:
{ θ i x i + ⋯ + θ k x k ∣ x i ∈ C , θ i ≥ 0 , i = 1 , ⋯   , k } \{\theta_ix_i+\cdots+\theta_kx_k|x_i\in C,\theta_i\ge 0,i=1,\cdots,k\} {θixi++θkxkxiC,θi0,i=1,,k}

常见的凸锥

  • 顶点位于0的扇形
  • 顶点位于0的射线
  • 位于0的单点集合

一些例子

  • 空集 ∅ \emptyset 、任意一点(即单点集) { x 0 } \{x_0\} {x0},全空间 R n \mathbf{R}^n Rn都是 R n \mathbf{R}^n Rn的仿射(自然也是凸的)子集。
  • 任意直线都是仿射的。如果直线过零点,则是子空间,因此也是凸锥。
  • 一条线段是凸的,但不是仿射的(除非退化成一个点)
  • 一条射线,即具有形式 { x 0 + θ v ∣ θ ≥ 0 } , v ≠ 0 \{x_0+\theta_v|\theta\ge0\},v\neq0 {x0+θvθ0},v=0的集合,是凸的,但不是仿射的,如果射线的基点 x 0 x_0 x0是0,则它是凸锥。
  • 任意子空间是仿射的、凸锥(自然也是凸的)

2.1 超平面与半空间

超平面是具有下面形式的集合:
{ x ∣ a T x = b } , a ∈ R n , a ≠ 0 且 b ∈ R \{x|a^Tx=b\},a\in \mathbf{R}^n, a\neq0且b\in \mathbf{R} {xaTx=b},aRn,a=0bR
解析地,超平面是关于 x x x的非平凡线性方程的解空间。几何上,可以解释为法线方向为 a a a的超平面,而常数 b ∈ R b\in \mathbf{R} bR决定了这个平面从原点的偏移。
一个超平面将 R n \mathbf{R}^n Rn划分为两个半空间

  • 超平面是仿射的,自然也是凸的。
  • 半空间是凸的,不是仿射的。

2.2 Euclid球和椭球


R n \mathbf{R}^n Rn中的空间Euclid球具有下面的形式:
B ( x c , r ) = { x ∣ ∥ x − x c ∥ 2 ≤ r } = { x ∣ ( x − x c ) T ( x − x c ) ≤ r 2 } B(x_c,r)=\{x | \Vert x-x_c\Vert_2\le r\} = \{x|(x-x_c)^T(x-x_c)\le r^2\} B(xc,r)={xxxc2r}={x(xxc)T(xxc)r2}
其中 r > 0 , ∥ ⋅ ∥ 2 r>0,\Vert \cdot \Vert_2 r>0,2表示Euclid范数。向量 x c x_c xc是球心, r r r为半径。

  • Euclid球是凸集(利用三角不等式可以证明)
  • 当半径为0时,为仿射集,当半径为0且球心在0处时,是凸锥

椭球

ϵ = { x ∣ ( x − x c ) T P − 1 ( x − x c ) ≤ 1 } \epsilon = \{x|(x-x_c)^TP^{-1}(x-x_c)\le 1\} ϵ={x(xxc)TP1(xxc)1}
其中 P = P T ≻ 0 P = P^T\succ 0 P=PT0,是对称正对矩阵。向量 x c ∈ R x_c\in \mathbf{R} xcR是椭球的中心。矩阵 P P P决定了椭球从球心向各个方向扩展的幅度。半轴长度有 P P P的奇异值决定。

  • 椭球是凸集

2.3 多面体polyhedron

多面体被定义为有限个线性等式和不等式的解集:
P = { x ∣ a j T x ≤ b , j = 1 , ⋯   , m , c j T x = d j , j = 1 , ⋯   , p } \mathcal{P} = \{x|a_j^Tx \le b,j=1,\cdots,m,c_j^Tx=d_j,j=1,\cdots,p\} P={xajTxb,j=1,,m,cjTx=dj,j=1,,p}
多面体是有限个半空间和超平面的交集。

  • 多面体不一定都是有界的
  • 多面体是凸集
  • 仿射集合、射线、线段、半空间都是多面体

单纯形 simplex
k + 1 k+1 k+1个点 v 0 , … , v k ∈ R n v_0,\ldots,v_k\in \mathbf{R}^n v0,,vkRn仿射独立,即 v 1 − v 0 , … , v k − v 0 v_1-v_0,\ldots,v_k-v_0 v1v0,,vkv0线性独立,那么这些点决定了一个单纯形,如下:
C = c o n v { v 0 , … , v k } = { θ 0 v 0 + … + θ k v k ∣ θ ≻ 0 , 1 T θ = 1 } C=\mathbf{conv}\{v_0,\ldots,v_k\}=\{\theta_0v_0+\ldots+\theta_kv_k|\theta\succ0,\mathbf{1}^T\theta=1\} C=conv{v0,,vk}={θ0v0++θkvkθ0,1Tθ=1}

  • 单纯形是一类重要的多面体

2.4半正定锥

对称矩阵集合: S n = { X ∈ R n × n ∣ X = X T } \mathbf{S}^n=\{X\in\mathbf{R}^{n \times n}|X=X^T\} Sn={XRn×nX=XT}
半正定对称矩阵集合: S + n = { X ∈ S n ∣ X ⪰ 0 } \mathbf{S}_+^n=\{X\in\mathbf{S}^n|X \succeq 0\} S+n={XSnX0}
正定对称矩阵集合: S + + n = { X ∈ S n ∣ X ≻ 0 } \mathbf{S}_{++}^n=\{X\in\mathbf{S}^n|X \succ 0\} S++n={XSnX0}

  • 集合 S n \mathbf{S}^n Sn是一个凸锥
  • 集合 S + n \mathbf{S}_+^n S+n是一个凸锥
  • 集合 S + + n \mathbf{S}_{++}^n S++n不是凸锥

你可能感兴趣的:(数学,凸优化)