这一章节研究度量空间的基本结构,在开始前,我们需要思考几个问题:
在这篇笔记的最后再来回答这个问题。
对于工科生来说,“空间”这个概念还是比较模糊的,但是我本人在学习数学的过程中发现很多数学的分支学科都是对于某个空间进行研究,比如欧氏空间、内积空间、测度空间、拓扑空间、希尔伯特空间,以及这门课要学习的度量空间等等。
个人觉得,定义空间的同时往往伴随着相应的某种运算的定义,也就是说我们研究空间的时候,主要还是为了研究某些运算,为了保证运算前后的结果都有比较好的性质(或者说便于处理),我们才抽象出了对应的空间的概念。回到这门课,泛函分析里面将要遇到的空间都是度量空间,因此我们首先需要知道他的定义。
“度量”实际上指的就是抽象的“距离”,比如两个点的距离、两个向量的距离、两个无穷长序列的距离、两个连续函数的距离。尽管点、向量、无穷长序列、连续函数的形式差别很大,但是如果我们都把他们抽象成为高维空间中的一个点,我们可以用相似的方式定义距离(也就是度量)的概念。
这样一来,由于大多数时候我们关心的是两个高维点之间的相对距离,而不是他们本身的绝对坐标(比如我们研究数列收敛性 x n → x x_n\to x xn→x 的时候,只需要分析 ∣ x n − x ∣ → 0 |x_n-x|\to 0 ∣xn−x∣→0 是否成立,而不太关心 x x x 具体是什么),因此抽象出距离这个概念之后,我们就可以把点、向量、序列、连续函数都统一的看待,用统一的方法和理论处理相似的问题。
首先,我们可以抽象出一个集合 X X X。 X X X 可以是一个实数点集,比如 X = R X=\mathbb{R} X=R;也可以是一个多维实空间 X = R n X=\mathbb{R}^n X=Rn,他的元素就是向量;也可以是连续函数集 X = C [ a , b ] X=C[a,b] X=C[a,b],表示区间 [ a , b ] [a,b] [a,b] 上的所有连续函数构成的集合。
现在问题的关键就是如何定义度量?当然不能随意定义,我们必须要他满足一定条件,才能称之为度量:
根据定义可以看出来,度量就是一种距离,称 ( X , d ) (X,d) (X,d) 为度量空间(或距离空间)。下面给出一些度量空间的例子,要证明是否是度量只需要验证几条定义即可。
注:后面的内容基本都默认我们是在度量空间 ( X , d ) (X,d) (X,d) 中讨论,为了书写省劲,一般都没有明确写出来“存在度量空间 ( X , d ) (X,d) (X,d)”,但是需要注意我们是在度量空间中讨论的。
例子 1(离散度量) :定义
d ( x , y ) = { 0 , x = y 1 , x ≠ y d(x,y) = \begin{cases} 0, & x=y \\ 1, & x\ne y \end{cases} d(x,y)={0,1,x=yx=y
例子 2:记 X = K X=\mathbb{K} X=K,其中我们记 K = R or C \mathbb{K}=\mathbb{R} \text{ or } \mathbb{C} K=R or C(后面的笔记也都保持这个习惯), d ( x , y ) = ∣ x − y ∣ d(x,y)=|x-y| d(x,y)=∣x−y∣,那么 ( X , d ) (X,d) (X,d) 是一个度量空间。
例子 3: X = K n , d p ( x , y ) = ∥ x − y ∥ p = ( ∑ i ∣ x i − y i ∣ p ) 1 / p X=\mathbb{K}^n, d_p(\boldsymbol{x,y})=\|\boldsymbol{x-y}\|_p = (\sum_i |x_i-y_i|^p)^{1/p} X=Kn,dp(x,y)=∥x−y∥p=(∑i∣xi−yi∣p)1/p,对于 1 ≤ p ≤ ∞ 1\le p \le \infty 1≤p≤∞, ( X , d p ) (X,d_p) (X,dp) 是度量空间。
例子 4: X = ℓ p , d p ( x , y ) = ∥ x − y ∥ p X=\ell^p,d_p(\boldsymbol{x,y})=\|\boldsymbol{x-y}\|_p X=ℓp,dp(x,y)=∥x−y∥p,对于 1 ≤ p ≤ ∞ 1\le p\le \infty 1≤p≤∞, ( ℓ p , d p ) (\ell^p,d_p) (ℓp,dp) 是度量空间。其中
ℓ p = { ( x n ) n ≥ 1 , x n ∈ K , ∃ c ≥ 0 , ∣ x n ∣ ≤ c } \ell^p = \left\{(x_n)_{n\ge1},\ x_n\in\mathbb{K},\ \exists c\ge0,\ |x_n|\le c \right\} ℓp={(xn)n≥1, xn∈K, ∃c≥0, ∣xn∣≤c}
这个在证明的过程中需要证明 ∀ x , y ∈ ℓ p \forall x,y\in\ell^p ∀x,y∈ℓp,都有 x + y ∈ ℓ p x+y \in \ell^p x+y∈ℓp。
例子3、4的证明过程中还需要用到两个比较重要的不等式:Hölder 不等式和 Minkowski 不等式。
Hölder不等式: ∀ 1 ≤ p , q ≤ ∞ , 1 p + 1 q = 1 , ∀ x , y ∈ R n \forall 1\le p,q\le\infty, \frac{1}{p}+\frac{1}{q}=1,\forall x,y\in\mathbb{R}^n ∀1≤p,q≤∞,p1+q1=1,∀x,y∈Rn,有
∑ i = 1 n ∣ x i y i ∣ ≤ ∥ x ∥ p ∥ y ∥ q \sum_{i=1}^{n}|x_iy_i| \le \|x\|_p \|y\|_q i=1∑n∣xiyi∣≤∥x∥p∥y∥q
当 p = q = 2 p=q=2 p=q=2 的时候,上面的式子就退化成 Cauchy-Schwarz 不等式。证明:可以取 u ( t ) = t p − 1 , t ≥ 0 u(t)=t^{p-1},t\ge0 u(t)=tp−1,t≥0,反函数就有 t = u 1 p − 1 = u q − 1 , u ≥ 0 t=u^{\frac{1}{p-1}}=u^{q-1},u\ge0 t=up−11=uq−1,u≥0。考虑可能有下面两种情况:
以第一种情况为例, ∫ 0 α t p − 1 d t + ∫ 0 β u q − 1 d u = α p p + β q q ≥ α β \int_0^\alpha t^{p-1}dt + \int_0^\beta u^{q-1}du = \frac{\alpha^p}{p}+\frac{\beta^q}{q} \ge \alpha\beta ∫0αtp−1dt+∫0βuq−1du=pαp+qβq≥αβ,第二种情况也有相同的结果。我们可以首先假设 ∥ x ∥ p = ∥ y ∥ q = 1 \|x\|_p = \|y\|_q=1 ∥x∥p=∥y∥q=1,因而就有
∣ x i y i ∣ ≤ ∣ x i ∣ p p + ∣ y i ∣ q q ⟹ ∑ ∣ x i y i ∣ ≤ 1 = ∥ x ∥ p ∥ y ∥ q |x_iy_i| \le \frac{|x_i|^p}{p} + \frac{|y_i|^q}{q} \\ \Longrightarrow \sum |x_iy_i| \le 1 = \|x\|_p \|y\|_q ∣xiyi∣≤p∣xi∣p+q∣yi∣q⟹∑∣xiyi∣≤1=∥x∥p∥y∥q
如果 ∥ x ∥ p ≠ 1 \|x\|_p \ne 1 ∥x∥p=1,那么我们可以取 x ′ = x / ∥ x ∥ p x' = x/\|x\|_p x′=x/∥x∥p,代入上面的情况就能得到 Hölder 不等式了。证毕。Minkowski 不等式: ∀ x , y ∈ ℓ p , p ≥ 1 \forall x,y\in\ell^p, p\ge1 ∀x,y∈ℓp,p≥1,都有
∥ x + y ∥ p ≤ ∥ x ∥ p + ∥ y ∥ p . \|x+y\|_p \le \|x\|_p + \|y\|_p . ∥x+y∥p≤∥x∥p+∥y∥p.
证明:证毕。
对于空间 ℓ p \ell^p ℓp 还有如下有趣的性质:
例子 5(无穷维向量) :定义 S = { ( x n ) n ≥ 1 , x n ∈ K } S=\{(x_n)_{n\ge1}, x_n\in\mathbb{K}\} S={(xn)n≥1,xn∈K},定义如下度量
d ( x , y ) = ∑ n = 1 ∞ 1 2 n ∣ x n − y n ∣ 1 + ∣ x n − y n ∣ < ∞ d(x,y) = \sum_{n=1}^\infty\frac{1}{2^n}\frac{|x_n-y_n|}{1+|x_n-y_n|} < \infty d(x,y)=n=1∑∞2n11+∣xn−yn∣∣xn−yn∣<∞
则 ( S , d ) (S,d) (S,d) 是度量空间。
例子 6(连续函数) : X = C [ a , b ] , d p ( x , y ) = ( ∫ a b ∣ x ( t ) − y ( t ) ∣ p d t ) 1 / p , 1 ≤ p ≤ ∞ X=C[a,b],\ d_p(x,y) = \left(\int_a^b |x(t)-y(t)|^pdt\right)^{1/p},\ 1\le p\le\infty X=C[a,b], dp(x,y)=(∫ab∣x(t)−y(t)∣pdt)1/p, 1≤p≤∞,则 ( X , d ) (X,d) (X,d) 是度量空间。
上面一小节分析了度量空间 ( X , d ) (X,d) (X,d) 中度量 d d d 的定义,这一部分研究一下集合 X X X 的性质。我们主要从开集和闭集这个角度来分析集合的结构。
需要注意的是在实空间 R \mathbb{R} R 当中我们对开集(开区间)都比较熟悉了,但是还有很多其他很复杂的集合,比如上面提到的连续函数构成的集合 C [ a , b ] C[a,b] C[a,b],这种情况下什么是开集呢?这个时候我们就需要抽象出“开集”这个概念最为本质的性质了。
定义:开球 B ( x 0 , δ ) = { x ∈ X , d ( x , x 0 ) < δ } B(x_0,\delta)=\{x\in X,\ d(x,x_0)<\delta\} B(x0,δ)={x∈X, d(x,x0)<δ},闭球 B ˉ ( x 0 , δ ) = { x ∈ X , d ( x , x 0 ) ≤ δ } \bar{B}(x_0,\delta)=\{x\in X,\ d(x,x_0)\le\delta\} Bˉ(x0,δ)={x∈X, d(x,x0)≤δ},球面 S ( x 0 , δ ) = { x ∈ X , d ( x , x 0 ) = δ } . S(x_0,\delta)=\{x\in X,\ d(x,x_0)=\delta\}. S(x0,δ)={x∈X, d(x,x0)=δ}.
定义: ( X , d ) , M ⊂ X (X,d),M\subset X (X,d),M⊂X,称 x 0 ∈ M x_0\in M x0∈M 为 M M M 的内点,若 ∃ δ > 0 , B ( x 0 , δ ) ⊂ M \exists \delta>0, B(x_0,\delta)\subset M ∃δ>0,B(x0,δ)⊂M, M M M 的所有内点的集合称为 M M M 的内部,记为 M ˚ \mathring{M} M˚。
定义: M M M 为开集 ⟺ M = M ˚ ⟺ ∀ x ∈ M , ∃ δ > 0 , B ( x , δ ) ⊂ M \iff M=\mathring{M} \iff \forall x\in M,\ \exists \delta>0,\ B(x,\delta)\subset M ⟺M=M˚⟺∀x∈M, ∃δ>0, B(x,δ)⊂M。
定义: F ⊂ X F\subset X F⊂X 为闭集 ⟺ F c = X ∖ F \iff F^c=X\setminus F ⟺Fc=X∖F 为开集。
定义:闭包 M ˉ = { x ∈ X , ∀ δ > 0 , B ( x , δ ) ∩ M ≠ ∅ } . \bar{M}=\{x\in X,\ \forall \delta>0,\ B(x,\delta)\cap M\ne \varnothing \}. Mˉ={x∈X, ∀δ>0, B(x,δ)∩M=∅}.
注 1:有的集合可能既不是开集,也不是闭集!比如实空间 R \mathbb{R} R 中区间 [ 0 , 1 ) [0,1) [0,1)。
注 2:但是假如现在考虑的不是实空间,而是 X = [ 0 , + ∞ ) X=[0,+\infty) X=[0,+∞),那么 [ 0 , 1 ) [0,1) [0,1) 就是开集!判断是否是开集还是要根据定义!
例子 1(离散度量空间) : ( X , d ) (X,d) (X,d) 为离散度量空间,那么任意的 M ⊂ X M\subset X M⊂X 都是既开又闭的集合。因为我们可以取 ∀ x ∈ M , B ( x , 1 / 2 ) = { x } ⊂ M \forall x\in M,\ B(x,1/2)=\{x\}\subset M ∀x∈M, B(x,1/2)={x}⊂M。
命题: M ˚ \mathring{M} M˚ 为包含在 M M M 中的最大开集。
证明:分为三个过程:1) M ˚ ⊂ M \mathring{M}\subset M M˚⊂M;**2) M ˚ \mathring{M} M˚ 为开集;**3) M ˚ \mathring{M} M˚ 最大。注意不要忘了第 2) 部分,细节略。
定理: ( X , d ) (X,d) (X,d),则
证明:略。
定理: ( X , d ) (X,d) (X,d),则
证明:略。
性质:闭包 M ˉ \bar{M} Mˉ 为闭集,且 M ˉ \bar{M} Mˉ 为包含 M M M 的最小闭集。
推论: ( X , d ) , M ⊂ X (X,d), M\subset X (X,d),M⊂X, M M M 为闭集 ⟺ M = M ˉ . \iff M=\bar{M}. ⟺M=Mˉ.
证明:略。
拓扑空间
拓扑的定义是:给集合 X X X 指定拓扑,就是指定集合 X X X 中哪些子集是开集,指定的方式需要满足:
- R , ∅ R,\varnothing R,∅ 是开集;
- 开集的有限交仍然是开集;
- 开集的任意并仍然是开集。
X X X 上的拓扑 T \mathcal{T} T 是 X X X 的子集族,满足上述的条件。定义了拓扑 T \mathcal{T} T 的集合 X X X 称为拓扑空间。对于拓扑空间 ( X , T ) (X,\mathcal{T}) (X,T) 有子集 O \mathcal{O} O,若 O ∈ T \mathcal{O}\in \mathcal{T} O∈T,则称 O \mathcal{O} O 为开集。
注1:先有拓扑 T \mathcal{T} T,然后如果 X X X 的子集 O ∈ T \mathcal{O}\in \mathcal{T} O∈T,才有 O \mathcal{O} O 是开集的说法。
注2:拓扑空间跟度量空间类似,首先定义了一种运算,比如度量空间是需要定义度量,拓扑空间是需要定义对开集封闭的运算(有限交、任意并),其中的元素对这些运算封闭,然后才有空间的概念.
定义:称 M ⊂ X M\subset X M⊂X 是 X X X 的稠密子集,若 M ˉ = X \bar{M}=X Mˉ=X。换一种表述方式,也就是说 ∀ x ∈ X , ∀ δ > 0 , B ( x , δ ) ∩ M ≠ ∅ \forall x\in X,\forall \delta > 0, B(x,\delta)\cap M\ne \varnothing ∀x∈X,∀δ>0,B(x,δ)∩M=∅。
例子 1: ( R , d ) (\mathbb{R},d) (R,d),其中 d ( x , y ) = ∣ x − y ∣ d(x,y)=|x-y| d(x,y)=∣x−y∣,则 Q ˉ = R . \bar{\mathbb{Q}}=\mathbb{R}. Qˉ=R.
例子 2: ( C , d ) (\mathbb{C},d) (C,d),其中 d ( x , y ) = ∣ x − y ∣ d(x,y)=|x-y| d(x,y)=∣x−y∣,则 Q + i Q ‾ = C . \overline{\mathbb{Q}+i\mathbb{Q}}=\mathbb{C}. Q+iQ=C.
例子 3: ( R n , d 2 ) (\mathbb{R}^n,d_2) (Rn,d2),则 Q n ‾ = R n . \overline{\mathbb{Q}^n}=\mathbb{R}^n. Qn=Rn.
例子 4:对于 1 ≤ p ≤ ∞ 1\le p\le \infty 1≤p≤∞,定义 M = { ( x n ) n ≥ 1 , x n ∈ Q , ∃ N , ∀ n ≥ N , x n = 0 } M=\{(x_n)_{n\ge1},\ x_n\in\mathbb{Q},\exists N,\forall n\ge N, x_n=0 \} M={(xn)n≥1, xn∈Q,∃N,∀n≥N,xn=0},那么对于度量 d p d_p dp,有 M ˉ = ℓ p . \bar{M}=\ell^p. Mˉ=ℓp.
性质:对于两个度量 d 1 , d 2 d_1,d_2 d1,d2,如果存在 c 1 , c 2 > 0 c_1,c_2>0 c1,c2>0,对 ∀ x , y ∈ X \forall x,y\in X ∀x,y∈X,都有 c 1 d 1 ( x , y ) ≤ d 2 ( x , y ) ≤ c 2 d 1 ( x , y ) c_1d_1(x,y)\le d_2(x,y)\le c_2 d_1(x,y) c1d1(x,y)≤d2(x,y)≤c2d1(x,y),也即这两个度量相互控制,那么对任意 M ⊂ X M\subset X M⊂X,有 M M M 的闭包相同,内部也相同。
例子 5:对于离散度量空间, X X X 的稠密子集只有 X X X 本身。
例子 6: X = C [ a , b ] X=C[a,b] X=C[a,b], d ∞ ( x , y ) = max t ∈ [ a , b ] ∣ x ( t ) − y ( t ) ∣ d_\infty(x,y)=\max_{t\in[a,b]} |x(t)-y(t)| d∞(x,y)=maxt∈[a,b]∣x(t)−y(t)∣,因此 M = { 多 项 式 p ( t ) = a 0 + a 1 t + ⋯ + a N t N , a i ∈ Q } M=\{多项式 p(t)=a_0+a_1t+\cdots+a_Nt^N,a_i\in\mathbb{Q}\} M={多项式p(t)=a0+a1t+⋯+aNtN,ai∈Q},则 M ˉ = X . \bar{M}=X. Mˉ=X.
定义:称度量空间 ( X , d ) (X,d) (X,d) 是可分的,若 ∃ M \exists M ∃M 为至多可数集(有限集或者可数集),并且 M ˉ = X . \bar{M}=X. Mˉ=X.
这里先介绍几个关于可数集的性质:
例子 1: { 0 , 1 } N \{0,1\}^{\mathbb{N}} {0,1}N 不是可数集!其中 N \mathbb{N} N 为自然数集。
例子 2: ( K n , d p ) (\mathbb{K}^n, d_p) (Kn,dp) 可分。
例子 3: ( ℓ p , d p ) (\ell^p,d_p) (ℓp,dp) 可分, M M M 与上面例子 4 的定义相同。
例子 4: ( C [ a , b ] , d ∞ ) (C[a,b],d_\infty) (C[a,b],d∞) 可分, M M M 与上面例子 6 的定义相同。
例子 5: ( ℓ ∞ , d ∞ ) (\ell^\infty,d_\infty) (ℓ∞,d∞) 不可分。
证明:反证法。参考课本 P14,略。
这一部分则开始考虑 X X X 中的元素序列,以及序列的极限是否存在、极限是什么的问题。之所以考虑序列这件事情,是因为我们实际中处理问题的时候往往是用序列去逼近一个元素,序列当中的每个元素可能是简单的,二最后去逼近的这个元素往往是不太显然或者比较复杂的东西。这样我们只需要证明序列中的元素满足某些性质,就能证明最后的极限具有某些特殊性质,更容易处理。
我们对序列收敛性的定义是对于 x n , x ∈ R x_n,x\in\mathbb{R} xn,x∈R,称 x n x_n xn 收敛到 x x x,记为 x n → x x_n\to x xn→x ( lim n → ∞ x n = x \lim_{n\to\infty} x_n=x limn→∞xn=x),若 ∀ ε > 0 , ∃ N , ∀ n ≥ N \forall \varepsilon> 0,\exists N,\ \forall n\ge N ∀ε>0,∃N, ∀n≥N,都有 ∣ x n − x ∣ < ε |x_n-x|<\varepsilon ∣xn−x∣<ε。换一种表述方式就是在度量空间 ( X , d ) (X,d) (X,d) 中, d ( x n , x ) → 0 d(x_n,x)\to 0 d(xn,x)→0。
注:需要注意的是只有 x ∈ X x\in X x∈X,我们才能说 x n → x x_n\to x xn→x。例如取 X = ( 0 , 1 ) , x n = 1 n + 1 X=(0,1),x_n=\frac{1}{n+1} X=(0,1),xn=n+11,那么 x n x_n xn 在 X X X 中不收敛。
命题:若 x n → x x_n\to x xn→x,则 { x n } n ≥ 1 \{x_n\}_{n\ge1} {xn}n≥1 为有界集合,且 x x x 唯一。
定理:度量空间 ( X , d ) (X,d) (X,d),有 M ⊂ X M\subset X M⊂X,那么
证明:第一条应用定义,第二条应用第一条的结论。细节略。
定义: x n ∈ X x_n\in X xn∈X,称 x n x_n xn 为柯西列,若 ∀ ε > 0 , ∃ N , ∀ m , n ≥ N \forall \varepsilon > 0,\exists N, \forall m,n\ge N ∀ε>0,∃N,∀m,n≥N,则 d ( x m , x n ) < ε d(x_m,x_n)<\varepsilon d(xm,xn)<ε。称 X X X 是完备的,若 ∀ x n ∈ X \forall x_n\in X ∀xn∈X 为柯西列,则 ∃ x ∈ X , x n → x \exists x\in X,x_n \to x ∃x∈X,xn→x。
注:实际上,收敛列一定是柯西列,即 { 收 敛 列 } ⊂ { 柯 西 列 } \{收敛列\} \subset \{柯西列\} {收敛列}⊂{柯西列};而如果 X X X 又是完备的,那么说明柯西列也一定是收敛列。因此 X X X 完备 ⟺ { 柯 西 列 } = { 收 敛 列 } \iff \{柯西列\}=\{收敛列\} ⟺{柯西列}={收敛列}。
命题: x n x_n xn 为柯西列,则 { x n , n ≥ 1 } \{x_n,n\ge 1\} {xn,n≥1} 为有界集。
例子 1: ( R , d 1 ) (\mathbb{R},d_1) (R,d1) 完备; ( K n , d p ) (\mathbb{K}^n, d_p) (Kn,dp) 完备; ( ℓ ∞ , d ∞ ) (\ell^\infty, d_\infty) (ℓ∞,d∞) 完备; ( ℓ p , d p ) (\ell^p,d_p) (ℓp,dp) 完备; ( C [ a , b ] , d ∞ ) (C[a,b],d_\infty) (C[a,b],d∞) 完备。
证明:证明完备性的套路:
例子 2: ( C [ a , b ] , d p ) (C[a,b], d_p) (C[a,b],dp) 不完备(反例如下图所示); Q \mathbb{Q} Q 不完备(因为不是闭集); c 00 c_{00} c00 (有限个元素不为零的序列)不完备。
定理:度量空间 ( X , d ) (X,d) (X,d)
证明:第一条应用闭集对极限封闭的性质;第二条反向应用 ( X , d ) (X,d) (X,d) 完备的性质。细节略。
定理:若 x n ∈ C [ a , b ] , x n ⇉ x x_n\in C[a,b],x_n\rightrightarrows x xn∈C[a,b],xn⇉x(一致收敛),则 x ∈ C [ a , b ] x\in C[a,b] x∈C[a,b]。
前面从单个度量空间的角度来考虑元素的性质,现在考虑两个度量空间的对应关系,也就是映射。
对于实空间的映射 f : ( a , b ) → R f:(a,b)\to \mathbb{R} f:(a,b)→R,我们对连续性的定义为: f f f 在 t 0 ∈ ( a , b ) t_0\in(a,b) t0∈(a,b) 处连续,若 lim t → t 0 f ( t ) = f ( t 0 ) \lim_{t\to t_0}f(t)=f(t_0) limt→t0f(t)=f(t0)。由于我们在度量空间中已经定义了距离 ,因此可以将其推广至度量空间。
假设有度量空间 ( X 1 , d 1 ) (X_1,d_1) (X1,d1) 和 ( X 2 , d 2 ) (X_2,d_2) (X2,d2),映射 T : X 1 → X 2 T:X_1 \to X_2 T:X1→X2。
定义:称映射 T T T 在 t = t 0 t=t_0 t=t0 处连续,若 ∀ ε > 0 , ∃ δ > 0 \forall \varepsilon > 0,\ \exists \delta > 0 ∀ε>0, ∃δ>0,使得 ∀ t ∈ X 1 , d 1 ( t , t 0 ) < δ \forall t\in X_1,\ d_1(t,t_0)<\delta ∀t∈X1, d1(t,t0)<δ,都有 d 2 ( T t , T t 0 ) < ε d_2(Tt, Tt_0)<\varepsilon d2(Tt,Tt0)<ε。若 T T T 在 ∀ t ∈ X 1 \forall t\in X_1 ∀t∈X1 处都连续,则称 T T T 为连续映射。
例子 1:若 ( X 1 , d 1 ) (X_1,d_1) (X1,d1) 为离散度量空间,那么任意 T : X 1 → X 2 T:X_1 \to X_2 T:X1→X2 一定是连续映射。证明只需要套用定义,取 δ = 1 / 2 \delta=1/2 δ=1/2 即可。
例子 2(Lipschitz 连续): ∃ c > 0 , ∀ s , t ∈ X 1 \exists c>0,\ \forall s,t\in X_1 ∃c>0, ∀s,t∈X1 都有 d 2 ( T s , T t ) < c d 1 ( s , t ) d_2(Ts,Tt)< c d_1(s,t) d2(Ts,Tt)<cd1(s,t),那么 T T T 是连续映射。
定理: T T T 为连续映射 ⟺ ∀ G ⊂ X 2 \iff \forall G\subset X_2 ⟺∀G⊂X2 为开集,那么 T − 1 ( G ) = { x ∈ X 1 , T x ∈ G } T^{-1}(G)=\{x\in X_1, Tx\in G\} T−1(G)={x∈X1,Tx∈G} 是 X 1 X_1 X1 中的开集。
证明:" ⟹ \Longrightarrow ⟹":若已知 T T T 连续, G G G 为开集
G G G 为开集,就有 ∀ x 0 ∈ T − 1 ( G ) , ∃ ε > 0 , B ( T x 0 , ε ) ⊂ G \forall x_0\in T^{-1}(G),\exists \varepsilon > 0,\ B(Tx_0,\varepsilon)\subset G ∀x0∈T−1(G),∃ε>0, B(Tx0,ε)⊂G
由于 T T T 连续,则一定 ∃ δ > 0 \exists \delta > 0 ∃δ>0,使得 ∀ x ∈ B ( x 0 , δ ) \forall x\in B(x_0, \delta) ∀x∈B(x0,δ),都有 T x ∈ B ( T x 0 , ε ) Tx\in B(Tx_0,\varepsilon) Tx∈B(Tx0,ε),因而 B ( x 0 , ε ) ⊂ X 1 B(x_0,\varepsilon)\subset X_1 B(x0,ε)⊂X1
故 T − 1 ( G ) T^{-1}(G) T−1(G) 为开集。
“ ⟸ \Longleftarrow ⟸”:假设 ∀ G ⊂ X 2 \forall G\subset X_2 ∀G⊂X2 为开集, T − 1 ( G ) T^{-1}(G) T−1(G) 在 X 1 X_1 X1 中也是开集,那么套用连续映射的定义,就能证明 T T T 为连续映射。
证毕。
推论: T T T 为连续映射 ⟺ ∀ F ⊂ X 2 \iff \forall F\subset X_2 ⟺∀F⊂X2 为闭集,那么 T − 1 ( F ) = { x ∈ X 1 , T x ∈ F } T^{-1}(F)=\{x\in X_1, Tx\in F\} T−1(F)={x∈X1,Tx∈F} 是 X 1 X_1 X1 中的闭集。
定理: T T T 在 x 0 x_0 x0 处连续 ⟺ ∀ x n ∈ X 1 , x n → x 0 \iff \forall x_n\in X_1, x_n\to x_0 ⟺∀xn∈X1,xn→x0,则 T x n → T x 0 Tx_n \to Tx_0 Txn→Tx0。
证明:" ⟹ \Longrightarrow ⟹":应用定义;
“ ⟸ \Longleftarrow ⟸”:反证法,假设 T T T 在 x 0 x_0 x0 处不连续,
那么 ∃ ε 0 > 0 , ∀ δ > 0 , ∃ x ∈ B ( x 0 , δ ) \exists \varepsilon_0 > 0,\forall \delta >0, \exists x\in B(x_0, \delta) ∃ε0>0,∀δ>0,∃x∈B(x0,δ),使得 d ( T x 0 , T x ) > ε 0 d(Tx_0, Tx) > \varepsilon_0 d(Tx0,Tx)>ε0
可以取 δ = 1 / n \delta = 1/n δ=1/n,由此构造出一个序列 x n ∈ B ( x 0 , 1 / n ) x_n \in B(x_0,1/n) xn∈B(x0,1/n),
可以知道 x n → x 0 x_n\to x_0 xn→x0,但是却有 d ( x n , x 0 ) ≥ ε 0 d(x_n,x_0) \ge \varepsilon_0 d(xn,x0)≥ε0,与假设矛盾。
证毕。
推论: T : X 1 → X 2 T:X_1\to X_2 T:X1→X2 处处连续 ⟺ ∀ x n → x , T x n → T x \iff \forall x_n\to x, Tx_n \to Tx ⟺∀xn→x,Txn→Tx。
不动点想必大家在别的地方都或多或少听说过或者用过,应该是解决很多问题的重要工具。在这一部分的内容里面则可以看到,前面讲的序列收敛性、映射在不动点定理当中的应用。
定义:考虑 X ≠ ∅ , T : X → X X\ne\varnothing, T:X\to X X=∅,T:X→X,若 x 0 ∈ X , T x 0 = x 0 x_0\in X,Tx_0=x_0 x0∈X,Tx0=x0,则称 x 0 x_0 x0 为 T T T 的不动点。
定义: T : X → X T:X\to X T:X→X,假设 ∃ 0 ≤ α < 1 \exists 0\le \alpha < 1 ∃0≤α<1,使得 ∀ x , y ∈ X \forall x,y\in X ∀x,y∈X,都有 d ( T x , T y ) ≤ α d ( x , y ) d(Tx,Ty) \le \alpha d(x,y) d(Tx,Ty)≤αd(x,y),则称 T T T 为压缩映射。
定理(Banach不动点定理):假设 ( X , d ) (X,d) (X,d) 为非空、完备度量空间, T : X → X T:X\to X T:X→X 为压缩映射,则 T T T 存在唯一的不动点。
证明:考虑 x 0 ∈ X , x 1 = T x 0 , ⋯ , x n = T x n − 1 , ⋯ x_0\in X,x_1=Tx_0,\cdots,x_n=Tx_{n-1},\cdots x0∈X,x1=Tx0,⋯,xn=Txn−1,⋯,那么可以首先证明 x n x_n xn 为柯西列,进而存在收敛值 x x x。 由于 d ( x n , x n + 1 ) = d ( x n , T x n ) → 0 d(x_n,x_{n+1})=d(x_n,Tx_n)\to 0 d(xn,xn+1)=d(xn,Txn)→0,从而趋向于 x = T x x=Tx x=Tx。之后再证明唯一性。证毕。
定理:假设 ( X , d ) (X,d) (X,d) 非空完备, T : X → X T:X\to X T:X→X,设 ∃ m ≥ 1 \exists m\ge1 ∃m≥1, T m T^m Tm 为压缩映射,则 ∃ ! x ∈ X \exists! x\in X ∃!x∈X 使得 T x = x Tx=x Tx=x。
证明:只需要证明 S = T m S=T^m S=Tm 的不动点都是 T T T 的不动点,反之 T T T 的不动点也都是 S S S 的不动点即可。
由不动点定理可知, S S S 存在唯一一个不动点,记为 y 0 y_0 y0,即 S y 0 = y 0 Sy_0=y_0 Sy0=y0,那么 S T y 0 = T m + 1 y 0 = T S y 0 = T y 0 STy_0=T^{m+1}y_0=TSy_0=Ty_0 STy0=Tm+1y0=TSy0=Ty0,即 T y 0 Ty_0 Ty0 也是 S S S 的不动点,因此一定有 T y 0 = y 0 Ty_0=y_0 Ty0=y0,即 y 0 y_0 y0 也是 T T T 的不动点。假设 z 0 z_0 z0 是 T T T 的不动点,那么很容易证明他也是 S S S 的不动点。因此 T T T 存在唯一不动点。证毕。
例子 1: c > 0 c>0 c>0,求 c \sqrt{c} c 的数值解。可以用数值迭代,取 f ( x ) = ( x + c x ) / 2 , D = [ c , + ∞ ) f(x)=(x+\frac{c}{x})/2,D=[\sqrt{c},+\infty) f(x)=(x+xc)/2,D=[c,+∞),求不动点即可。
例子 2: ( X = K n , d ∞ ) , C ∈ K n × n , b ∈ K n (X=\mathbb{K}^n,d_\infty),C\in\mathbb{K}^{n\times n},b\in\mathbb{K}^n (X=Kn,d∞),C∈Kn×n,b∈Kn,映射 T x = C x + b Tx=Cx+b Tx=Cx+b。容易证明若 ∀ i , ∑ j ∣ a i j ∣ < 1 \forall i,\sum_j|a_{ij}|<1 ∀i,∑j∣aij∣<1,则 T T T 为压缩映射。
例子 3:考虑 ( t 0 , x 0 ) ∈ R 2 , a , b > 0 (t_0,x_0)\in \mathbb{R}^2,a,b>0 (t0,x0)∈R2,a,b>0,考虑矩形 R = [ t 0 − a , t 0 + a ] × [ x 0 − b , x 0 + b ] R=[t_0-a,t_0+a]\times[x_0-b,x_0+b] R=[t0−a,t0+a]×[x0−b,x0+b],连续函数 f : R → R f:R\to\mathbb{R} f:R→R,假设存在 k ≥ 0 , ∣ f ( t , u ) − f ( t , v ) ∣ ≤ k ∣ u − v ∣ , ∀ ( t , u ) , ( t , v ) ∈ R k\ge0,|f(t,u)-f(t,v)|\le k|u-v|,\forall (t,u),(t,v)\in R k≥0,∣f(t,u)−f(t,v)∣≤k∣u−v∣,∀(t,u),(t,v)∈R。考虑初值问题
( P ) : { x ′ ( t ) = f ( t , x ( t ) ) x ( t 0 ) = x 0 (P):\begin{cases} x'(t)=f(t,x(t)) \\ x(t_0)=x_0 \end{cases} (P):{x′(t)=f(t,x(t))x(t0)=x0
求上述初值问题的解 x ( t ) ∈ C [ t 0 − β , t 0 + β ] , 0 < β ≤ a x(t)\in C[t_0-\beta,t_0+\beta],0<\beta\le a x(t)∈C[t0−β,t0+β],0<β≤a。
解:首先给出结论:如果给定 c = max ( t , x ) ∈ R ∣ f ( t , x ) ∣ , 0 < β < min { a , b c , 1 k } c=\max_{(t,x)\in R}|f(t,x)|,0<\beta<\min\{a,\frac{b}{c},\frac{1}{k}\} c=max(t,x)∈R∣f(t,x)∣,0<β<min{a,cb,k1},那么存在唯一的 x ∈ C 1 [ t 0 − β , t 0 + β ] x\in C^1[t_0-\beta,t_0+\beta] x∈C1[t0−β,t0+β],使得当 t ∈ [ t 0 − β , t 0 + β ] t\in[t_0-\beta,t_0+\beta] t∈[t0−β,t0+β] 时,有 x ( t ) ∈ [ x 0 − b , x 0 + b ] x(t)\in[x_0-b,x_0+b] x(t)∈[x0−b,x0+b] 且 x x x 满足方程 ( P ) (P) (P)。下面给出证明。
由于 x ′ ( t ) = f ( t , x ( t ) ) ⟹ ∫ t 0 t x ′ ( τ ) d τ = ∫ t 0 t f ( τ , x ( τ ) ) d τ ⟹ x ( t ) = x 0 + ∫ t 0 t f ( τ , x ( τ ) ) d τ x'(t)=f(t,x(t)) \Longrightarrow \int_{t_0}^t x'(\tau)d\tau=\int_{t_0}^t f(\tau,x(\tau))d\tau \Longrightarrow x(t)=x_0+\int_{t_0}^t f(\tau,x(\tau))d\tau x′(t)=f(t,x(t))⟹∫t0tx′(τ)dτ=∫t0tf(τ,x(τ))dτ⟹x(t)=x0+∫t0tf(τ,x(τ))dτ,
可以证明 ∣ x ( t ) − x 0 ∣ ≤ c β < b ⟹ ( t , x ( t ) ) ∈ R |x(t)-x_0|\le c\beta ∣x(t)−x0∣≤cβ<b⟹(t,x(t))∈R。
( X , d ∞ ) (X,d_\infty) (X,d∞) 完备,取 M = B ˉ ( x 0 , c β ) M=\bar{B}(x_0,c\beta) M=Bˉ(x0,cβ) 为闭集,因此 M M M 为完备的,
取 T x = x 0 + ∫ t 0 t f ( τ , x ( τ ) ) d τ Tx=x_0+\int_{t_0}^t f(\tau,x(\tau))d\tau Tx=x0+∫t0tf(τ,x(τ))dτ,也可以证明 d ∞ ( T x , x 0 ) ≤ c β ⟹ T x ∈ M d_\infty(Tx,x_0)\le c\beta \Longrightarrow Tx\in M d∞(Tx,x0)≤cβ⟹Tx∈M,即 T : M → M T:M\to M T:M→M,
又容易证明 T T T 为压缩映射,因而存在唯一的 x ∈ M x\in M x∈M 使得 T x = x Tx=x Tx=x,只需要迭代即可获得 x ( t ) x(t) x(t)。
例子 4(隐函数存在定理) :略。
这一章当中讲解了度量空间、开集闭集、序列收敛性、柯西列、集合完备性、映射与连续性,以及最后的Banach不动点定理。现在我们已经完成了度量空间中的内容,你能够回答文章开头的问题了吗?对于度量空间这个概念有什么新的理解吗?
最后给我的博客打个广告,欢迎光临
https://glooow1024.github.io/
https://glooow.gitee.io/
前面的一些博客链接如下
泛函分析专栏
泛函分析笔记 0:绪论
泛函分析笔记 1:度量空间