抄书——最优化理论与方法(6)——凸集的分离和支撑

以下内容主要抄自抄袁亚湘的《最优化理论与方法》的 1.3.3 凸集的分离和支撑


凸集的分离和支撑是研究最优性条件的重要工具。我们首先讨论闭凸集外一点与闭凸集的极小距离
定理 1.3.17
S ∈ R n S\in R^n SRn 是非空闭凸集, y ∉ S y\notin S y/S,则存在唯一的点 x ˉ ∈ S \bar x\in S xˉS,它与 y y y 距离最短。进一步, x ˉ \bar x xˉ y y y 距离最短的充要条件是
( x − x ˉ ) T ( x ˉ − y ) ≥ 0 , ∀ x ∈ S ( 1.3.12 ) (x-\bar x)^T(\bar x-y)\ge 0,\qquad \forall x\in S\qquad(1.3.12) (xxˉ)T(xˉy)0,xS(1.3.12)
证明:

inf ⁡ { ∥ y − x ∥   ∣ x ∈ S } = γ > 0 ( 1.3.13 ) \inf \{ \Vert y-x\Vert\ \vert x\in S\}=\gamma\gt 0\qquad(1.3.13) inf{yx xS}=γ>0(1.3.13)
存在一个序列 { x k } ⊂ S \{x_k\}\subset S {xk}S 使得 ∥ y − x k ∥ → γ \Vert y-x_k\Vert \to \gamma yxkγ。下面我们证明 { x k } \{x_k\} {xk} 是 Cauchy 序列,从而存在极限 x ˉ ∈ S \bar x\in S xˉS
平行四边法则 ∥ x + y ∥ 2 + ∥ x − y ∥ 2 = 2 ( ∥ x ∥ 2 + ∥ y ∥ 2 ) \Vert x+y\Vert^2+\Vert x-y\Vert^2=2(\Vert x \Vert^2+\Vert y \Vert^2) x+y2+xy2=2(x2+y2)),有
∥ x k − x m ∥ 2 = 2 ∥ x k − y ∥ 2 + 2 ∥ x m − y ∥ 2 − ∥ x k + x m − 2 y ∥ 2 = 2 ∥ x k − y ∥ 2 + 2 ∥ x m − y ∥ 2 − 4 ∥ x k + x m 2 − y ∥ 2 ( 1.3.14 ) \Vert x_k-x_m\Vert^2 = 2\Vert x_k-y\Vert^2+ 2\Vert x_m-y\Vert^2-\Vert x_k+x_m-2y\Vert^2\\ =2\Vert x_k-y\Vert^2+ 2\Vert x_m-y\Vert^2-4\left\Vert \frac{x_k+x_m}2-y\right\Vert^2\qquad(1.3.14) xkxm2=2xky2+2xmy2xk+xm2y2=2xky2+2xmy242xk+xmy2(1.3.14)
注意到 ( x k + x m ) / 2 ∈ S (x_k+x_m)/2\in S (xk+xm)/2S,由(1.3.13)有:
∥ x k + x m 2 − y ∥ 2 ≥ γ 2 \left\Vert \frac{x_k+x_m}2-y\right\Vert^2\ge \gamma^2 2xk+xmy2γ2
因而
∥ x k − x m ∥ 2 ≤ 2 ∥ x k − y ∥ 2 + 2 ∥ x m − y ∥ 2 − 4 γ 2 \Vert x_k-x_m\Vert^2\le 2\Vert x_k-y\Vert^2+2\Vert x_m-y\Vert^2-4\gamma^2 xkxm22xky2+2xmy24γ2
于是,取 k k k m m m 充分大,则
∥ x k − x m ∥ → 0 \Vert x_k-x_m\Vert\to 0 xkxm0
从而 { x k } \{ x_k\} {xk} 是Cauchy序列,且有极限 x ˉ \bar x xˉ。因为 S S S 是闭的,故 x ˉ ∈ S \bar x\in S xˉS,这表明存在 x ˉ \bar x xˉ 使得 ∥ y − x ˉ ∥ = γ \Vert y-\bar x\Vert=\gamma yxˉ=γ
下面证明唯一性。假定 x ˉ ′ , x ˉ ∈ S \bar x',\bar x\in S xˉ,xˉS 满足
∥ y − x ˉ ∥ = ∥ y − x ˉ ′ ∥ = γ \Vert y-\bar x\Vert =\Vert y-\bar x'\Vert =\gamma yxˉ=yxˉ=γ
由S的凸性, ( x ˉ + x ˉ ′ ) / 2 ∈ S (\bar x+\bar x')/2\in S (xˉ+xˉ)/2S。于是
∥ y − x ˉ + x ˉ ′ 2 ∥ ≤ 1 2 ∥ y − x ˉ ∥ + 1 2 ∥ y − x ˉ ′ ∥ = γ \left\Vert y-\frac{\bar x+\bar x'}2 \right\Vert\le\frac12\Vert y-\bar x\Vert + \frac12\Vert y-\bar x'\Vert=\gamma y2xˉ+xˉ21yxˉ+21yxˉ=γ
如果严格不等号成立,则与 γ \gamma γ 的定义矛盾,从而在上述不等式中,仅仅只有等号成立,从而必有
y − x ˉ = λ ( y − x ˉ ′ ) , for some  λ y-\bar x=\lambda(y-\bar x')\quad, \text{for some $\lambda$} yxˉ=λ(yxˉ),for some λ
又由于 ∥ y − x ˉ ∥ = ∥ y − x ˉ ′ ∥ = γ \Vert y-\bar x\Vert=\Vert y-\bar x'\Vert=\gamma yxˉ=yxˉ=γ,故 ∣ λ ∣ = 1 \vert \lambda\vert =1 λ=1。若 λ = − 1 \lambda = -1 λ=1,则有 y = ( x ˉ + x ˉ ′ ) / 2 ∈ S y=(\bar x+\bar x')/2\in S y=(xˉ+xˉ)/2S,这与 y ∉ S y\notin S y/S 矛盾。从而, λ = 1 \lambda=1 λ=1,即 x ˉ = x ˉ ′ \bar x=\bar x' xˉ=xˉ。唯一性得证。
最后,证明 x ˉ ∈ S \bar x\in S xˉS y ∉ S y\notin S y/S 距离最短的充要条件 ( x − x ˉ ) T ( x ˉ − y ) ≥ 0 , ∀ x ∈ S (x-\bar x)^T(\bar x-y)\ge 0,\forall x\in S (xxˉ)T(xˉy)0,xS
x ∈ S , ( x − x ˉ ) T ( x ˉ − y ) ≥ 0 x\in S, (x-\bar x)^T(\bar x-y)\ge 0 xS,(xxˉ)T(xˉy)0。由于
∥ y − x ∥ 2 = ∥ y − x ˉ + x ˉ − x ∥ 2 = ∥ y − x ˉ ∥ 2 + ∥ x ˉ − x ∥ 2 + 2 ( x ˉ − x ) T ( y − x ˉ ) \Vert y-x \Vert^2=\Vert y-\bar x+\bar x-x\Vert^2\\ =\Vert y-\bar x\Vert^2+\Vert \bar x-x\Vert^2+2(\bar x-x)^T(y-\bar x) yx2=yxˉ+xˉx2=yxˉ2+xˉx2+2(xˉx)T(yxˉ)
∥ y − x ∥ 2 ≥ ∥ y − x ˉ ∥ 2 \Vert y-x \Vert^2\ge\Vert y-\bar x\Vert^2 yx2yxˉ2,从而 x ˉ \bar x xˉ y y y 有极小距离。
反之,设 ∥ y − x ∥ 2 ≥ ∥ y − x ˉ ∥ 2 , ∀ x ∈ S \Vert y-x\Vert^2\ge\Vert y-\bar x\Vert^2,\forall x\in S yx2yxˉ2,xS。注意到 x ˉ + λ ( x − x ˉ ) ∈ S \bar x+\lambda(x-\bar x)\in S xˉ+λ(xxˉ)S,对充分小的 λ > 0 \lambda\gt0 λ>0。于是,
∥ y − x ˉ − λ ( x − x ˉ ) ∥ 2 ≥ ∥ y − x ˉ ∥ 2 and: ∥ y − x ˉ − λ ( x − x ˉ ) ∥ 2 = ∥ y − x ˉ ∥ 2 + λ 2 ∥ x − x ˉ ∥ 2 + 2 λ ( x − x ˉ ) T ( x ˉ − y ) \Vert y-\bar x-\lambda(x-\bar x)\Vert^2 \ge \Vert y-\bar x\Vert^2\\ \text{and:}\\ \Vert y-\bar x-\lambda(x-\bar x)\Vert^2 = \Vert y-\bar x\Vert^2+\lambda^2\Vert x-\bar x\Vert^2+2\lambda(x-\bar x)^T(\bar x-y) yxˉλ(xxˉ)2yxˉ2and:yxˉλ(xxˉ)2=yxˉ2+λ2xxˉ2+2λ(xxˉ)T(xˉy)
从上面两式可得
λ 2 ∥ x − x ˉ ∥ 2 + 2 λ ( x − x ˉ ) T ( x ˉ − y ) ≥ 0 ,  for enought small  λ > 0 \lambda^2\Vert x-\bar x\Vert^2+2\lambda(x-\bar x)^T(\bar x-y)\ge 0, \text{ for enought small $\lambda\gt 0$} λ2xxˉ2+2λ(xxˉ)T(xˉy)0, for enought small λ>0
两边同除以 λ \lambda λ,并令 λ → 0 \lambda \to 0 λ0,便得结果。 □ \quad \square


现在,我们讨论点和凸集的分离定理,它是最基本的分离定理。
定理 1.3.8
S ⊂ R n S\subset R^n SRn 是非空闭凸集, y ∈ R n , y ∉ S y\in R^n,y\notin S yRn,y/S,则存在向量 p ≠ 0 p\neq0 p̸=0 和实数 α \alpha α,使得
p T y > α  and  p T x ≤ α , ∀ x ∈ S ( 1.3.15 ) p^Ty\gt \alpha\text{ and } p^Tx\le \alpha,\forall x \in S\qquad(1.3.15) pTy>α and pTxα,xS(1.3.15)
即存在超平面 H = { x ∣   p T x = α } H=\{x\vert \ p^Tx=\alpha\} H={x pTx=α} 严格分离 y y y S S S
证明:
因为 S S S 是闭凸集, y ∉ S y\notin S y/S,故由定理 1.3.17 知存在唯一的与 y y y 距离极小的点 x ˉ ∈ S \bar x\in S xˉS,使得
( x − x ˉ ) T ( x ˉ − y ) ≥ 0 , ∀ x ∈ S (x-\bar x)^T(\bar x -y)\ge 0, \quad \forall x\in S (xxˉ)T(xˉy)0,xS
此即
− x ˉ T ( y − x ˉ ) ≤ − x T ( y − x ˉ ) , ∀ x ∈ S ( 1.3.16 ) -\bar x^T(y-\bar x)\le -x^T(y-\bar x),\quad \forall x\in S\qquad(1.3.16) xˉT(yxˉ)xT(yxˉ),xS(1.3.16)
由于
∥ y − x ˉ ∥ 2 = ( y − x ˉ ) T ( y − x ˉ ) = y T ( y − x ˉ ) − x ˉ T ( y − x ˉ ) \Vert y-\bar x\Vert^2=(y-\bar x)^T(y-\bar x)=y^T(y-\bar x)-\bar x^T(y-\bar x) yxˉ2=(yxˉ)T(yxˉ)=yT(yxˉ)xˉT(yxˉ)
将其代入(1.3.16)有
y T ( y − x ˉ ) − x T ( y − x ˉ ) ≥ y T ( y − x ˉ ) − x ˉ T ( y − x ˉ ) = ∥ y − x ˉ ∥ 2 , ∀ x ∈ S → set  p = y − x ˉ → p T ( y − x ) ≥ ∥ y − x ˉ ∥ 2 → p T y ≥ p T x + ∥ y − x ˉ ∥ 2 , ∀ x ∈ S y^T(y-\bar x)-x^T(y-\bar x)\ge y^T(y-\bar x)-\bar x^T(y-\bar x)=\Vert y-\bar x\Vert^2,\forall x\in S\\ \to\quad \text{set } p=y-\bar x\\ \to p^T(y-x)\ge \Vert y-\bar x\Vert^2\to p^Ty\ge p^Tx+\Vert y-\bar x\Vert^2,\forall x\in S yT(yxˉ)xT(yxˉ)yT(yxˉ)xˉT(yxˉ)=yxˉ2,xSset p=yxˉpT(yx)yxˉ2pTypTx+yxˉ2,xS
α = sup ⁡ { p T x ∣   x ∈ S } \alpha=\sup\{p^Tx\vert \ x\in S\} α=sup{pTx xS},就有 p T y > α p^Ty\gt \alpha pTy>α p T x ≤ α p^Tx\le \alpha pTxα ,证毕。 □ \qquad\square


应用上述分离定理 1.3.18,可以得到在推导线性和非线性规划最优性条件中广泛利用的 Farkas 定理。
定理 1.3.19(Farkas 定理)
A ∈ R m × n , c ∈ R n A\in R^{m\times n},c\in R^n ARm×n,cRn,则下列两方程组有且仅有一组有解:
A x ≤ 0 , c T x > 0 , for some  x ∈ R n   ( 1.3.17 )   A T y = c , y ≥ 0 , for some  y ∈ R m   ( 1.3.18 ) Ax\le 0,\quad c^Tx\gt 0,\quad \text{for some $x\in R^n$ }\qquad(1.3.17)\\ \text{ } \\A^Ty=c, \quad y\ge 0, \quad \text{for some $y\in R^m$ }\qquad(1.3.18) Ax0,cTx>0,for some xRn (1.3.17) ATy=c,y0,for some yRm (1.3.18)
证明:
假设(1.3.18)有解,即存在 y ≥ 0 y\ge0 y0,使得 A T y = c A^Ty=c ATy=c。设 x x x 满足 A x ≤ 0 Ax\le 0 Ax0,则因为 y ≥ 0 y\ge 0 y0,有
c T x = y T A x ≤ 0 c^Tx=y^TAx\le 0 cTx=yTAx0
这表明(1.3.17)无解。
再假设(1.3.18)无解,记
S = { x ∣   x = A T y ,   y ≥ 0 } S=\{x\vert \ x=A^Ty,\ y\ge 0\} S={x x=ATy, y0}
S S S 是非空闭凸集,且 c ∉ S c\notin S c/S。由定理 1.3.18,存在 p ∈ R n p\in R^n pRn α ∈ R \alpha \in R αR,使得
p T c > α and p T x ≤ α , ∀ x ∈ S p^Tc\gt \alpha \quad \text{and} \quad p^Tx\le \alpha,\quad \forall x\in S pTc>αandpTxα,xS
由于 0 ∈ S 0 \in S 0S,故 α ≥ 0 \alpha \ge 0 α0,因而 p T c > 0 p^Tc\gt 0 pTc>0。又
α ≥ p T x = p T A T y = y T A p , ∀ y ≥ 0 \alpha \ge p^Tx=p^TA^Ty=y^TAp,\quad \forall y\ge 0 αpTx=pTATy=yTAp,y0
由于 y ≥ 0 y\ge 0 y0 可以任意大,故 A p ≤ 0 Ap\le 0 Ap0。这样我们构造了向量 p ∈ R n p\in R^n pRn,满足 A p ≤ 0 Ap\le 0 Ap0 p T c > 0 p^Tc\gt0 pTc>0,从而(1.3.17)有解。 □ \quad\square


此处证明需注意, x , y , A x x,y,Ax x,y,Ax 均是矢量,所谓 y ≥ 0 y\ge 0 y0 表示 y = { y 1 , y 2 , ⋯   , y m } ,   ∀ y i ≥ 0 y=\{y_1, y_2, \cdots,y_m\},\ \forall y_i\ge 0 y={y1,y2,,ym}, yi0


为了研究两个凸集间的分离关系,我们引入了下面的支撑超平面定义,并给出超平面支撑凸集的定理。
定义 1.3.20
S ⊂ R n S\subset R^n SRn 是非空集合, p ∈ R n , x ˉ ∈ ∂ S p\in R^n, \bar x\in \partial S pRn,xˉS,这里 ∂ S \partial S S 表示 S S S 的边界,
∂ S = { x ∈ R n ∣ S ∩ N δ ( x ) ≠ ∅ , ( R n ∖ S ) ∩ N δ ( x ) ≠ ∅ , ∀ δ > 0 } \partial S=\{x\in R^n\vert S\cap N_{\delta}(x)\neq \empty, (R^n\setminus S)\cap N_{\delta}(x)\neq \empty, \forall \delta\gt0\} S={xRnSNδ(x)̸=,(RnS)Nδ(x)̸=,δ>0}
其中 N δ ( x ) N_{\delta}(x) Nδ(x) 表示 x x x δ \delta δ 邻域,有 N δ ( x ) = { y ∣   ∥ y − x ∥ < δ } N_{\delta}(x)=\{y\vert \ \Vert y-x \Vert\lt \delta\} Nδ(x)={y yx<δ}。若有
S ⊂ H + = { x ∈ S ∣   p T ( x − x ˉ ) ≥ 0 } ( 1.3.19 ) S\subset H^+=\{ x\in S\vert \ p^T(x-\bar x)\ge 0\}\qquad(1.3.19) SH+={xS pT(xxˉ)0}(1.3.19)

S ⊂ H − = { x ∈ S ∣   p T ( x − x ˉ ) ≤ 0 } ( 1.3.20 ) S\subset H^-=\{ x\in S\vert \ p^T(x-\bar x)\le 0\}\qquad(1.3.20) SH={xS pT(xxˉ)0}(1.3.20)
则称超平面 H = { x ∣   p T ( x − x ˉ ) = 0 } H=\{x\vert \ p^T(x-\bar x)=0\} H={x pT(xxˉ)=0} S S S x ˉ \bar x xˉ 处的支撑超平面。此外,若 S ⊂ H S\cancel\subset H S H,则 H H H 称为 S S S x ˉ \bar x xˉ正常支撑超平面
现在,我们证明凸集在每一个边界点有一个支撑超平面


p p p 是超平面 H H H法线方向,而且在 x ˉ \bar x xˉ 上可能有多个法线方向,上述只是说明了存在性,并不对唯一性进行要求。


定理 1.3.21
S ⊂ R n S\subset R^n SRn 是非空凸集, x ˉ ∈ ∂ S \bar x\in \partial S xˉS。那么,在 x ˉ \bar x xˉ 处存在一个超平面支撑 S S S,即存在非零向量 p p p,使得
p T ( x − x ˉ ) , ∀ x ∈ c ∣ S , ( 1.3.21 ) p^T(x-\bar x),\quad \forall x\in c|S,\qquad (1.3.21) pT(xxˉ),xcS,(1.3.21)
这里 c ∣ S c|S cS 表示 S S S 的闭包, c ∣ S = { x ∈ R n ∣ S ∩ N δ ( x ) ≠ ∅ , ∀ δ > 0 } c|S=\{ x\in R^n| S\cap N_{\delta}(x)\neq \varnothing, \forall \delta\gt 0\} cS={xRnSNδ(x)̸=,δ>0}
证明:
因为 x ˉ ∈ S \bar x\in S xˉS,故存在序列 { y k } ⊂ c ∣ S \{ y_k\} \cancel\subset c|S {yk} cS,使得
y k → x ˉ , k → ∞ ( 1.3.22 ) y_k\to \bar x,\quad k\to \infty\qquad(1.3.22) ykxˉ,k(1.3.22)
由定理1.3.18,对应于每一个 y k y_k yk,存在 p k ∈ R n p_k\in R^n pkRn ∥ p k ∥ = 1 \Vert p_k\Vert =1 pk=1,使得
p k T y k > p k T x , ∀ x ∈ c ∣ S ( 1.3.23 ) p_k^Ty_k\gt p^T_kx,\quad \forall x\in c|S\qquad(1.3.23) pkTyk>pkTx,xcS(1.3.23)
由于 p k p_k pk 有界,故存在收敛子列 { p k } K \{p_k\}_{\mathcal K} {pk}K,其极限为 p , ∥ p ∥ = 1 p,\Vert p\Vert=1 p,p=1。对于这个子序列,显然(1.3.23)成立。固定 x ∈ c ∣ S x\in c|S xcS,令 k ∈ K , k → ∞ k\in \mathcal K,k\to\infty kK,k,取极限,便得到 p T ( x − x ˉ ) ≤ 0 p^T(x-\bar x)\le 0 pT(xxˉ)0。由于这个不等式对所有 x ∈ c ∣ S x\in c|S xcS 成立,从而结果得证。 □ \quad\square


利用定理 1.3.18 和 1.3.21,立即得到下面的推论。
推论 1.3.22
S ⊂ R n S\subset R^n SRn 是非空凸集, x ˉ ∈ S \bar x\in S xˉS,那么存在非零向量 p p p 使得
p T ( x − x ˉ ) ≤ 0 , ∀ x ∈ c ∣ S ( 1.3.24 ) p^T(x-\bar x)\le 0, \quad \forall x\in c|S\qquad(1.3.24) pT(xxˉ)0,xcS(1.3.24)

现在,我们来讨论两个凸集的分离定理。
定义 1.3.23
S 1 , S 2 ⊂ R n S_1,S_2\subset R^n S1,S2Rn 是非空凸集,若
p T x ≥ α , ∀ x ∈ S 1  and  p T x ≤ α , ∀ x ∈ S 2 ( 1.3.25 ) p^Tx\ge \alpha,\quad \forall x\in S_1 \quad\text{ and } \quad p^Tx\le \alpha,\quad \forall x\in S_2\qquad(1.3.25) pTxα,xS1 and pTxα,xS2(1.3.25)
则称超平面 H = { x ∣   p T x = α } H=\{x | \ p^Tx=\alpha\} H={x pTx=α} 分离 S 1 S_1 S1 S 2 S_2 S2。此外,若 S 1 ∪ S 2 ⊂ H S_1 \cup S_2 \cancel \subset H S1S2 H,则称 H H H正常分离 S 1 S_1 S1 S 2 S_2 S2。若
p T x > α , ∀ x ∈ S 1 and p T x < α , ∀ x ∈ S 2 ( 1.3.26 ) p^Tx\gt\alpha,\quad \forall x\in S_1\quad \text{and} \quad p^Tx\lt \alpha,\quad\forall x\in S_2\qquad(1.3.26) pTx>α,xS1andpTx<α,xS2(1.3.26)
则称 H H H严格分离 S 1 S_1 S1 S 2 S_2 S2。若
p T x ≥ α + ε , ∀ x ∈ S 1 and p T x ≤ α , ∀ x ∈ S 2 ( 1.3.27 ) p^Tx\ge\alpha+\varepsilon,\quad \forall x\in S_1\quad \text{and} \quad p^Tx\le \alpha,\quad\forall x\in S_2\qquad(1.3.27) pTxα+ε,xS1andpTxα,xS2(1.3.27)
则称 H H H强分离 S 1 S_1 S1 S 2 S_2 S2,其中 ε > 0 \varepsilon\gt0 ε>0所谓强分离,应该是可以找出一些间隔的。

定理 1.3.24两个凸集的分离定理
S 1 , S 2 ⊂ R n S_1,S_2\subset R^n S1,S2Rn 是非空凸集,若 S 1 ∩ S 2 = ∅ S_1\cap S_2=\varnothing S1S2=,则存在超平面分离 S 1 S_1 S1 S 2 S_2 S2,即存在非零向量 p ∈ R n p\in R^n pRn,使得
p T x 1 ≤ p T x 2 , ∀ x 1 ∈ c ∣ S 1 , ∀ x 2 ∈ c ∣ S 2 ( 1.3.28 ) p^Tx_1\le p^Tx_2,\quad \forall x_1\in c|S_1,\quad \forall x_2\in c|S_2\qquad (1.3.28) pTx1pTx2,x1cS1,x2cS2(1.3.28)
证明:

S = S 1 − S 2 = { x 1 − x 2 ∣   x 1 ∈ S 1 , x 2 ∈ S 2 } S=S_1-S_2=\{ x_1-x_2 | \ x_1\in S_1, x_2\in S_2\} S=S1S2={x1x2 x1S1,x2S2}
因为 S S S 是凸集,并且 0 ∈ S 0\cancel \in S 0 S(否则, S 1 ∩ S 2 ≠ ∅ S_1\cap S_2\neq \varnothing S1S2̸=),故由推论 1.3.22 知存在非零向量 p ∈ R n p\in R^n pRn,使得
p T x ≤ p T 0 = 0 , ∀ x ∈ c ∣ S p^Tx\le p^T0=0,\quad \forall x\in c|S pTxpT0=0,xcS
这意味着
p T x 1 ≤ p T x 2 , ∀ x 1 ∈ c ∣ S 1 , ∀ x 2 ∈ c ∣ S 2 p^Tx_1\le p^Tx_2,\quad \forall x_1\in c|S_1,\quad \forall x_2\in c|S_2 pTx1pTx2,x1cS1,x2cS2
证毕。 □ \quad\square


上述分离定理可以加强而得到强分离定理。
定理 1.3.25(两个凸集的强分离定理)
S 1 , S 2 ⊂ R n S_1,S_2\subset R^n S1,S2Rn 是闭凸集,且 S 1 S_1 S1 有界。若 S 1 ∩ S 2 = ∅ S_1\cap S_2=\varnothing S1S2=,则存在超平面强分离 S 1 S_1 S1 S 2 S_2 S2,即存在非零向量 p ∈ R n p\in R^n pRn ε > 0 \varepsilon\gt 0 ε>0,使得
inf ⁡ { p T x ∣ x ∈ S 1 } ≥ ε + sup ⁡ { p T x ∣ x ∈ S 2 } , ( 1.3.29 ) \inf \{p^Tx | x\in S_1\}\ge \varepsilon + \sup \{p^Tx | x\in S_2\},\qquad (1.3.29) inf{pTxxS1}ε+sup{pTxxS2},(1.3.29)
证明:
S = S 1 − S 2 S=S_1-S_2 S=S1S2。注意到 S S S 是凸集,并且 0 ∉ S 0\notin S 0/S。我们先证明 S S S 是闭的。设 { x k } ⊂ S , x k → x \{x_k\}\subset S,x_k\to x {xk}S,xkx。由 S S S 的定义, x k = y k − z k ,   y k ∈ S 1 ,   z k ∈ S 2 x_k=y_k-z_k,\ y_k\in S_1,\ z_k\in S_2 xk=ykzk, ykS1, zkS2。由于 S 1 S_1 S1 是紧的,故存在收敛子列 { y k } K ,   y k → y ,   y ∈ S 1 ,   k ∈ K \{y_k\}_{\mathcal K},\ y_k\to y,\ y\in S_1,\ k\in\mathcal K {yk}K, yky, yS1, kK。由于
y k − z k → x , y k → y ,   for   k ∈ K y_k-z_k\to x,\quad y_k\to y,\ \text{ for }\ k\in \mathcal K ykzkx,yky,  for  kK
故有 z k → z z_k\to z zkz。由于 S 2 S_2 S2 是闭的,故 z ∈ S 2 z\in S_2 zS2,因此,
x = y − z ,   y ∈ S 1 ,   z ∈ S 2 x=y-z, \ y\in S_1, \ z\in S_2 x=yz, yS1, zS2
这表明 x ∈ S x\in S xS,从而 S S S 是闭的。
于是由定理 1.3.18 可知,存在非零向量 p p p 和实数 ε \varepsilon ε,使得
p T x ≥ ε , ∀ x ∈ S   and   p T 0 < ε p^Tx\ge \varepsilon, \quad \forall x\in S \ \text{ and } \ p^T0\lt \varepsilon pTxε,xS  and  pT0<ε
因此, ε > 0 \varepsilon \gt 0 ε>0,由 S S S 的定义,我们得到
p T x 1 ≥ ε + p T x 2 , ∀ x 1 ∈ S 1 ,   x 2 ∈ S 2 p^Tx_1 \ge \varepsilon + p^Tx_2, \quad \forall x_1\in S_1,\ x_2\in S_2 pTx1ε+pTx2,x1S1, x2S2
从而结果得证。 □ \quad \square

你可能感兴趣的:(数学,抄书)