个人博客 Glooow ,欢迎各位大驾光临
区分两种集合的定义(下面的描述并不是严格的数学语言,领会意思就行了):
主要的区别就在于后面 θ \theta θ 的取值范围,简单理解就是说仿射集类似直线,凸集类似线段。
更一般的,仿射集都可以表示为线性方程组的解集,也即 { x ∣ A x = b } \{x|Ax=b\} {x∣Ax=b}
假如集合 S = { x 1 , . . . , x k } S=\{x_1,...,x_k\} S={x1,...,xk},则其凸包可以表示为
{ ∑ i = 1 k θ i x i ∣ ∑ θ i = 1 , θ i ≥ 0 } \left\{\sum_{i=1}^k\theta_i x_i \vert \sum\theta_i=1, \theta_i\ge0\right\} {i=1∑kθixi∣∑θi=1,θi≥0}
类比三维空间中的平面,可以有超平面的定义
{ x ∣ a T x = b } ( a ≠ 0 ) \left\{x\vert a^Tx=b\right\}(a\ne0) {x∣aTx=b}(a=0)
其中 a a a 就是该平面的法向量。
类似的,有半空间定义为
{ x ∣ a T x ≤ b } ( a ≠ 0 ) \left\{x\vert a^Tx\le b\right\}(a\ne0) {x∣aTx≤b}(a=0)
高维空间中的多面体定义为
{ x ∣ A x ⪯ b , C x = d } \left\{x\vert A x \preceq b, \quad C x=d \right\} {x∣Ax⪯b,Cx=d}
其中 ⪯ \preceq ⪯ 表示对每个元素都作比较。实际上就是求很多个半空间以及半平面的交集,与三维空间是类似的。
高维空间中的欧几里得球的定义为
B ( x c , r ) = { x ∣ ∥ x − x c ∥ 2 ≤ r } = { x c + r u ∣ ∥ u ∥ 2 ≤ 1 } B\left(x_{c}, r\right)=\left\{x |\left\|x-x_{c}\right\|_{2} \leq r\right\}=\left\{x_{c}+r u |\|u\|_{2} \leq 1\right\} B(xc,r)={x∣∥x−xc∥2≤r}={xc+ru∣∥u∥2≤1}
椭球的定义为
{ x ∣ ( x − x c ) T P − 1 ( x − x c ) ≤ 1 } = { x c + A u ∣ ∥ u ∥ 2 ≤ 1 } \left\{x |\left(x-x_{c}\right)^{T} P^{-1}\left(x-x_{c}\right) \leq 1\right\} = \left\{x_{c}+A u |\|u\|_{2} \leq 1\right\} {x∣(x−xc)TP−1(x−xc)≤1}={xc+Au∣∥u∥2≤1}
其中 P ∈ S + + n P \in \mathbf{S}_{++}^{n} P∈S++n (也即 P P P 为对称正定矩阵)。中间的矩阵 P P P 的作用就相当于在各个特征向量方向上进行了放缩。
Remarks:关于矩阵性质,可以参考我的矩阵论学习笔记,这里复习一个知识点。
- 正规矩阵的定义为满足 A H A = A A H A^HA=AA^H AHA=AAH 的矩阵 A A A 即为正规矩阵,因此对称矩阵、Hermit矩阵、酉矩阵都是正规矩阵。而正规矩阵有什么性质呢?正规矩阵可以对角化,且存在一组正交的特征向量!
- 正定矩阵的定义为满足 x T A x > 0 x^TAx>0 xTAx>0 的矩阵 A A A,实际上也就是说矩阵 A A A 的特征值均大于 0!
- 因此对称正定矩阵的性质有:所有特征向量正交,所有特征值大于 0。
范数 ∥ ⋅ ∥ \Vert\cdot\Vert ∥⋅∥ 需要满足以下性质
向量范数如 ∥ x ∥ 0 , ∥ x ∥ 1 , ∥ x ∥ 2 , ∥ x ∥ p , ∥ x ∥ ∞ \Vert x\Vert_0, \Vert x\Vert_1, \Vert x\Vert_2, \Vert x\Vert_p, \Vert x\Vert_\infty ∥x∥0,∥x∥1,∥x∥2,∥x∥p,∥x∥∞
矩阵范数如 ∥ X ∥ 2 , ∥ X ∥ p \Vert X\Vert_2, \Vert X\Vert_p ∥X∥2,∥X∥p
范数球的定义为
{ x ∣ ∥ x − x c ∥ ≤ r } \left\{x |\left\|x-x_{c}\right\| \leq r\right\} {x∣∥x−xc∥≤r}
我们先来看看锥的定义
注意锥一定包含原点 0。锥不一定是凸的,反例如下,这是一个锥,但不是凸锥
范数锥定义如下
{ ( x , t ) ∣ ∥ x ∥ ≤ t } \{(x, t) |\|x\| \leq t\} {(x,t)∣∥x∥≤t}
也被称为 Ice cream cone。其中欧几里得范数锥被称为二阶锥(second-order cone)
定义几个符号
例如给定二阶矩阵
[ x y y z ] ∈ S + 2 \left[\begin{array}{ll} {x} & {y} \\ {y} & {z} \end{array}\right] \in \mathrm{S}_{+}^{2} [xyyz]∈S+2
其坐标满足如下图
上面是一些常见的凸集,对于更复杂的情况,怎么判断是否为凸集呢?
任意个(可以是无数个)凸集的交集仍然是凸集
例子 1: S = { x ∈ R m ∣ ∣ p ( t ) ∣ ≤ 1 for ∣ t ∣ ≤ π / 3 } S=\left\{x \in \mathbf{R}^{m}|| p(t) | \leq 1 \text { for }|t| \leq \pi / 3\right\} S={x∈Rm∣∣p(t)∣≤1 for ∣t∣≤π/3},其中 p ( t ) = x 1 cos t + x 2 cos 2 t + ⋯ + x m cos m t p(t)=x_{1} \cos t+x_{2} \cos 2 t+\cdots+x_{m} \cos m t p(t)=x1cost+x2cos2t+⋯+xmcosmt
若映射 f : R n → R m f: \mathbf{R}^{n} \rightarrow \mathbf{R}^{m} f:Rn→Rm 是仿射变换
f ( x ) = A x + b with A ∈ R m × n , b ∈ R m f(x)=A x+b \text { with } A \in \mathbf{R}^{m \times n}, b \in \mathbf{R}^{m} f(x)=Ax+b with A∈Rm×n,b∈Rm
则有
例子 2:双曲锥 { x ∣ x T P x ≤ ( c T x ) 2 , c T x ≥ 0 } ( with P ∈ S + n ) \left\{x | x^{T} P x \leq\left(c^{T} x\right)^{2}, c^{T} x \geq 0\right\}\left(\text { with } P \in \mathbf{S}_{+}^{n}\right) {x∣xTPx≤(cTx)2,cTx≥0}( with P∈S+n),因为其可以转化为二阶锥
例子 3: { x ∣ x 1 A 1 + ⋯ + x m A m ⪯ B } \left\{x | x_{1} A_{1}+\cdots+x_{m} A_{m} \preceq B\right\} {x∣x1A1+⋯+xmAm⪯B}(with A i , P ∈ S p A_i,P\in S^p Ai,P∈Sp)???
投影函数 P : R n + 1 → R n P: \mathbf{R}^{n+1} \rightarrow \mathbf{R}^{n} P:Rn+1→Rn
P ( x , t ) = x / t , dom P = { ( x , t ) ∣ t > 0 } P(x, t)=x / t, \quad \operatorname{dom} P=\{(x, t) | t>0\} P(x,t)=x/t,domP={(x,t)∣t>0}
Proof:略。应用凸集定义
分式线性映射 f : R n → R m f: \mathbf{R}^{n} \rightarrow \mathbf{R}^{m} f:Rn→Rm 为
f ( x ) = A x + b c T x + d , dom f = { x ∣ c T x + d > 0 } f(x)=\frac{A x+b}{c^{T} x+d}, \quad \text { dom } f=\left\{x | c^{T} x+d>0\right\} f(x)=cTx+dAx+b, dom f={x∣cTx+d>0}
其可以看作先仿射变换再投影变换。