漫步凸分析六——凸集的相对内点

根据定义, Rn 中点 x,y 之间的欧几里得距离是

d(x,y)=|xy|=xy,xy1/2

函数 d (欧几里得度量)是 R2n 上的凸函数,(这个结论基于的事实是:将欧几里得范数 f(z)=|z| 和从 R2n Rn 的线性变换 (x,y)xy 结合即可) Rn 中我们熟悉的闭集(closed set),开集(open set),闭包(closure)和内点(interior)这些拓扑概念通常可以用向量相对于欧几里得度量收敛的形式引入,但是这种收敛等价于 Rn 中一向量序列收敛。

下面我们将看到 Rn 中凸集的拓扑概念比其他集合都要简单。

凸函数是开集和闭集的一个重要来源, Rn 上任意连续实值函数 f 有开水平集 {x|f(x)<α} 和闭水平集 {x|f(x)α} ,并且当 f 是凸时这些集合也是凸的(定理4.6)。

本文中,我们将用 B 表示 Rn 中的欧几里得单位球(Euclidean unit ball):

B={x||x|1}={x|d(x,0)1}

这是一个凸集(欧几里得范数的一个水平集,欧几里得范数是连续且凸的),对于任意 aRn ,圆心为 a 半径为 ε>0 的球为

{x|d(x,a)ε}={a+y||y|ε}=a+εB

对于 Rn 上的任意集 C ,与 C 的距离不超过 ε 的点 x 集合是

{x|yC,d(x,y)ε}={y+εB|yC}=C+εB

因此 C 的闭包 cl C 和内点 int C 可以表示成

cl Cint C={C+εB|ε>0}={x|ε>0,x+εBC}

对于凸集,有一个更加方便的概念:相对内点(relative interior),引入这个概念的原因是嵌入在 R3 中的线段和三角形没有内点。 Rn 中凸集 C 的相对内点我们用 ri C 表示,当把 C 看成其仿射包 aff C 的子集时,其相对内点和内点的定义一样,因此 ri C xaff C 的点组成,并且存在 ε>0 ,使得 yaff C,d(x,y)ε yC 。换句话说,

ri C={xaff C|ε>0,(x+εB)(aff C)C}

显然,

ri CCcl C

集合差 (cl C)(ri C) 称为 C 的相对边界(relative boundary),自然地,当 ri=C 时,我们说 C 是相对开的(relatively open)。

对于 n 为凸集,根据定义 aff C=Rn ,所以 ri C=int C

注意,当 C1C2 时,这就暗含了 cl C1cl C2,int C1int C2 ,但是一般情况下 ri C1ri C2 是不成立的。例如,如果 C1 R3 中的立方体, C2 C1 的某个面, ri C1 ri C2 都非空但不相交。

根据定理仿射集是相对开的,同时是闭的。这个结论基于以下事实:仿射集是超平面的交(推论1.4.1)并且每个超平面 H 可以表示成连续函数的水平集(定理1.3):

H={x=(ξ1,,ξn)|β1ξ1++βnξn=β}

另外对于任意 C

cl Ccl(aff C)=aff C

因此通过 cl C 中任意两个不同点的直线完全在 aff C

平移和 Rn 到自身一对一的仿射变换保留闭包和相对内点,事实上,这样的变换保留仿射包并且两个方向都是连续上(因为在仿射变换下向量 x 像的元素是 x 元素 ξj 的线性或仿射函数)。建议大家记住这个结论,因为它将会帮助我们简化证明过程。例如,如果 C Rn m 为凸集,利用推论1.6.1存在 Rn 到自身的一对一仿射变换 T aff C 搬运到子空间的位置

L={x=(ξ1,,ξm,ξm=1,,ξn)|ξm+1=0,,ξn=0}

这个 L 可以看成 Rm 的一份拷贝,利用这种方式我们通常可以将一般的凸集问题简化为凸集是全维的情况,即,整个空间就是它的仿射包。

下面关于凸集闭包和相对内点的性质是基本的。

定理6.1 C Rn 中的凸集,令 xri C,ycl C ,那么对于 0λ<1 (1λ)x+λy 属于 ri C (自然属于 C )。

证明:利用前面的讨论,我们可以只考虑 C n 维的情况,这样的话 ri C=int C 。令 λ[0,1) ,那么我们必须标明对于 ε>0,(1λ)x+λy+εB 包含在 C 中。因为 ycl C ,所以 yC+εB ,那么对于每个 ε>0

(1λ)x+λy+εB(1λ)x+λ(C+εB)+εB=(1λ)[x+ε(1+λ)(1λ)1B]+λC

根据假设 xint C ,所以当 ε 充分小时,后面那个集合含于 (1λ)C+λC=C ||

下面两个定理描述了 Rn 中所有凸集上的运算 cl,ri 最重要的性质。

定理6.2 C Rn 上的任意凸集,那么 cl C,ri C Rn 上的凸集且和 C 有相同的仿射包,于是维数也相同。(特别地,如果 C ,那么 ri C )

证明:对于任意 ε ,集合 C+εB 是凸的,因为它是凸集合的线性组合。对于所有的 ε>0 ,所有这些集合的交是 cl C ,因此 cl C 是凸的。 cl C 的仿射包最起码和 C 的仿射包一样大,因为 cl Caff C ,实际上它和 aff C 是一样大的, ri C 的凸性是前面定理(取 y 属于 ri C )的推论。为了完成证明,接下来需要说明当 C n 维的时候 n>0 C 的内点非空, n 为凸集包含一个 n 维单纯形(定理2.4),然后我们需要说明这样的单纯形 S 有非空内点。我们假设 S 的顶点是向量 (0,0,,0),(1,0,,0),,(0,,0,1) :

S={(ξ1,,ξn)|ξj0,ξ1++ξn1}

(如果需要的话可以进行反射变换),但是这个单纯形有非空内点,即

int S={(ξ1,,ξn)|ξj>0,ξ1++ξn<1}

因此 int S ||

对于 Rn 中的任意集 C ,不管凸还是非凸,法则

cl(cl C)=cl C,ri(ri C)=ri C

都是成立的,下面的法则在凸的情况下才成立。

定理6.3 对于 Rn 中的任意凸集 C cl(ri C)=cl C,ri(cl C)=ri C

证明:因为 ri CC ,所以 cl(ri C) 含于 cl C ,另一方面,给定任意的 ycl C,xri C (根据上面的定理当 C 时这样的 x 肯定存在),位于 x,y 之间的线段除了 y 外(定理6.1) 完全位于 ri C 内,因此 ycl(riC) ,这就证明了 cl(ri C)=cl C 。因为 cl CC 并且 cl C C 的仿射包是一致的,所以 ri(cl C)ri C

接下来令 zri(cl C) ,我们将说明 zri C 。 令 x ri C 中的任一点,(我们假设 xz ,否则的话 zri C 定理成立)考虑通过 x,z 的直线,对于 μ>1 μ1 充分小,那么在这条直线上的点

y=(1μ)x+μz=z(μ1)(xz)

属于 ri(cl C) 因此属于 cl C 。 对于这样的一个 y ,我们可以将 z 表示成 (1λ)x+λy,0<λ<1 (特别地 λ=μ1 ),根据定理6.1, zri C ||

推论6.3.1 C1,C2 Rn 中的凸集,那么当且仅当 ri C1=ri C2,cl C1=cl C2 ,这个条件等价于 ri C1C2cl C1

推论6.3.2 如果 C Rn 上的凸集,那么和 cl C 有交点的开集也和 ri C 有交点。

推论6.3.3 如果 C1 Rn 上非空凸集 C2 相对边界的凸子集,那么 dimC1<dimC2

证明:如果 C1 C2 有同样的维数,那么它相对于 aff C2 将会有内点,但是这种点不可能含于 cl(ri C2) ,因为 ri C2 C1 是不相交的,因此他们不可能含于 cl C2 ||

下面介绍的相对内点特征经常被用到,而且非常有用。

定理6.4 C Rn 中非空凸集,那么当且仅当对于每个 xC ,存在 μ>1 使得 (1μ)x+μz 属于 C 时, zri C

证明:定理中的条件意味着 C 中每条以 z 为端点的线段可以在 z 上延长而不离开 C ,如果 zri C 那么这明显为真。反过来,假设 z 满足条件。根据定理6.2,因为 ri C ,所以存在一个点 xri C ,令 y C 中对应的点 (1μ)x+μz,μ>1 ,(根据假设它是存在的),那么 z=(1λ)x+λy,0<λ=μ1<1 ,因此根据定理6.1 zri C ||

推论6.4.1 C Rn 中的凸集,那么当且仅当对于每个 yRn ,存在 ε>0 使得 z+εyC 时, zint C

接下来我们考虑在凸集上执行同样的运算相对内点将如何变化的问题。

定理6.5 对于 iI (索引集)令 Ci Rn 中的凸集,假设集合 ri Ci 至少有一个公共点,那么

cl{Ci|iI}={cl Ci|iI}

如果 I 是有限的,那么

ri{Ci|iI}={ri Ci|iI}

证明:固定 x 为任意一个含于集合 ri Ci 交的元素,给定 y 为任意一个含于集合 cl Ci 交的元素,根据定理6.1,向量 (1λ)x+λy 属于每个 ri Ci,0λ<1 ,并且 y 是这个向量随着 λ1 时的极限,下式是成立的

icl Cicliri CicliCiicl Ci

这就建立了本定理的闭包公式,同时它也证明了 iri Ci,iCi 有相同的闭包。根据推论6.3.1,最后两个集合肯定有相同的相对内点,因此

riiCiiri Ci

假设 I 是有限的,我们接下来证明反向包含关系,取任意 ziri Ci ,根据定理6.4, iCi 中任意以 z 为端点的线段可以在每个集合 iCi 中稍微延长,这些延长线段的交含于原来线段 iCi 之中,这是因为他们只是有限多个。因此根据定理6.4的判定准则 ziCi ||

当集合 ri Ci 没有公共点时,定理6.5中的公式不成立,考虑 I=1,2 的一个实例, C1 R2 中不含原点的正象限而 C2 R2 的水平轴,第二个公式中还需要 I 是有限的:对于 α>0 的实区间 [0,1+α] 的交集是 [0,1] ,但是对于 α>0 的实区间 ri [0,1+α] 的交不是 ri [0,1]

推论6.5.1 C 是凸集,令 M 是仿射集(像直线和超平面)且包含 ri C 中的一个点,那么

ri (MC)=Mri C,cl (MC)=Mcl C

证明:对于仿射集, ri M=M=cl M ||

推论6.5.2 C1 是凸集,令 C2 是含于 cl C1 而又没有完全含于 C1 相对内点的凸集,那么 ri C2ri C1

证明:推论中的假设暗示 ri C2 ri(cl C1)=ri C1 有一个公共点,否则的话相对边界 cl C1ri C1 将包含 ri C2 和它的闭包 cl C2 ,因此

ri C2ri C1=ri C2ri(cl C1)=ri(C2cl C1)=ri C2

ri C2ri C1 ||

定理6.6 C Rn 中的凸集,令 A 是从 Rn Rm 的线性变换,那么

ri(AC)=A(ri C),cl(AC)A(cl C)

证明:闭包的包含关系仅仅反映了线性变换是连续的这个事实;它不依赖于 C 是否为凸。为了证明相对内点的结论,我们首先讨论

cl A(ri C)A(cl (ri C))=A(cl C)ACA(ri C)

这就表明 AC A(ri C) 有相同的闭包,于是根据推论6.3.1也有相同的相对内点,因此 ri(AC)A(ri C) 。现在假设 zA(ri C) ,我们将用定理6.4来表明 zri(AC) ,令 x AC 中的任意一点,选择任意元素 zri C,xC 使得 Az=z,Ax=x ,存在某个 μ>1 使得向量 (1μ)x+μz 属于 C ,在 A 的变换下这个向量的像是 (1μ)x+μz ,于是对于某个 μ>1,(1μ)x+μz 属于 AC ,因此 zri(AC) ||

定理6.6中 cl(AC) A(cl C) 之间可能的差异将会在第9节讨论。

推论6.6.1 对于任意凸集 C 和任意实数 λ ri(λC)=λri C

证明: A:xλx ||

对于凸集 C1Rm,C2Rp Rm+p 中的直和 C1C2 ,我们有

ri(C1C2)cl(C1C2)=ri C1ri C2=cl C1cl C2

当与定理6.6结合时,我们得到下面的事实。

推论6.6.2 对于 Rn 中的任意凸集 C1,C2

ri(C1+C2)cl(C1+C2)=ri C1+ri C2cl C1+cl C2

证明: C1+C2=A(C1C2) ,其中 A R2n Rn 的加法线性变换,即 A:(x1,x2)x1+x2 ||

推论6.6.2将会在推论9.1.1和9.1.2中深入讨论。

定理6.7 A 是从 Rn Rm 的线性变换,令 C Rm 中的凸集,使得 A1(ri C) ,那么

ri(A1C)=A1(ri C),cl(A1C)=A1(cl C)

证明: D=RnC ,令 M A 的图像,那么 M 是一个仿射集(事实上如第1节说的那样是一个子空间)并且 M 包含 ri D 中的一个点。令 P 是从 Rn+m Rn 的投影 (x,y)x ,那么 A1C=P(MD) ,根据定理6.6和推论6.5.1,我们有

ri(A1C)cl(A1C)=P(ri(MD))=P(Mri D)=A1(ri C)P(cl(MD))=P(Mcl D)=A1(cl C)

A 的连续性暗含了 cl(A1C)A1(cl C) ||

现在考虑 m=n=2 时定理6.7的一个反例,此时相对内点不满足条件。 C R2 的不包含原点的正象限,而 A (ξ1,ξ2) 投影到 (ξ1,0) 上。

通过上面的结果可知,对于相对开凸集,有限的交,标量乘法,加法和线性(仿射)变换下取像或原像运算后依然是相对开凸集。

定理6.8 C Rm+p 中的凸集,对于每个 yRm ,令 Cy 是向量 zRp 的集合,使得 (y,z)C 。令 D={y|Cy} ,那么当且仅当 yri D,zri Cy (y,z)ri C

证明:投影 (x,y)y C 搬到 D 上,根据定理6.6也将 ri C 搬到 ri D 上。给定 yri D 和仿射集 M={(y,z)|zRp} ri C 中的点就是

Mri C=ri(MC)=(y,z)|zri Cy

公式中的第一个等式由推论6.5.1得出,因此任意给定 yri D ,当且仅当 zri Cy 时我们有 (y,z)ri C ||

推论6.8.1 C Rn 中的非空凸集,令 K {(1,x)|xC} 生成的 Rn+1 中的凸锥,那么 ri K (λ,x) 组成,其中 λ>0,xλri C

证明:令定理中的 Rm=R,Rp=Rn ||

利用上面介绍的,我们可以构造一个很简单实例。由非空凸集 C 生成的 Rn 中凸锥的相对内点由形如 λx 的向量组成,其中 λ>0,xri C 。对于这种锥闭包的形式将会在定理9.8中给出。

仔细观察可以得出,凸锥的相对内点和相对闭包也一直是凸锥,这可以从推论6.6.1中立刻得出,因为对于凸集 C ,当且仅当对每个 λ>0 λC=C ,这个凸集是凸锥。

定理6.9 C1,,Cm Rn 中的非空凸集,令 C0=conv(C1Cm) 。那么

ri C0={λ1ri C1++λmri Cm|λi>0,λ1++λm=1}

证明: Ki {(1,xi)|xiCi},i=0,1,,m 生成的 Rn+1 中的凸锥,那么

K0=conv(K1Km)=K1++Km

(定理3.8),于是利用推论6.6.2

ri K0=ri K1++ri Km

根据推论6.8.1, ri Ki (λi,xi) 组成,其中 λi>0,xiλiri Ci ,因此 x0ri C0 等价于 (1,x0)ri K0 ,转而等价于

x0(λ1ri C1++λmri Cm)

其中 λ1>0,,λm>0,λ1++λm=1 ||

定理6.9中 C0 的闭包将会在定理9.8中讨论。

附:文章PDF版本http://pan.baidu.com/s/1mhGNjuw

你可能感兴趣的:(漫步凸分析)