重要!本文并不严谨,只提供直觉上的认知。
空间是拥有某种性质的集合。比如任何东西放在一起都可以成为集合,桌子,椅子,数,矩阵,函数,甚至空……如果集合内的元素满足某些性质,我们就可以把这个集合称为空间。
通俗的说,就是一个集合 X X X满足下面的条件。
可以在这个集合上定义两种运算,我们记为 “+”(加法)和“.”(数乘)
容易验证以下是线性空间:
通俗的说,两个线性空间中的元素能够建立起一一对应的关系,那么这两个线性空间是同构的。
可以用下面的方法检验两个线性空间是否同构:
设有两个线性空间 X , X ~ X, \tilde{X} X,X~,我们对这两个空间中的元素建立如下关系,对于任意 x ∈ X x \in X x∈X,均有唯一的 x ~ ∈ X ~ \tilde{x} \in \tilde{X} x~∈X~ 使得 φ ( x ) = x ~ \varphi(x) = \tilde{x} φ(x)=x~, 对于任意 x , y ∈ X x,y \in X x,y∈X 及 任意实数 λ \lambda λ 有:
φ ( x + y ) = φ ( x ) + φ ( y ) φ ( λ x ) = λ φ ( x ) \varphi(x+y) = \varphi(x) +\varphi(y) \\\varphi(\lambda x) = \lambda \varphi(x) φ(x+y)=φ(x)+φ(y)φ(λx)=λφ(x)
一般来说我们研究的空间都存在维度,比如N维向量,子空间通俗理解就是降维。子空间本身也是一个线性空间,且其每一个元素都属于原空间。例如,在三维空间 R 3 R_3 R3 中,任何过原点的平面都是 R 3 R_3 R3 的二维子空间。那么显然一个空间的子空间必须包含原空间中的零元素 θ \theta θ.
仿射流形就是一个子空间,与原空间某一元素的叠加(平移)。仿射流形并不一定是线性空间,因为其不一定包含零元素。
在二维平面中与过原地的直线L平行的所有直线都是对应于L的仿射流形。
同理在三维空间中,所有平行于过原点平面L的平面都是对应于L的二维仿射流形。
距离空间在线性空间的基础上增加了对距离概念的定义。有了距离概念,就可以对空间中的元素进行拓扑排序。可以去定义开集,闭集等需要用距离去定义的概念。
距离的定义需要满足下面的几个约束:
非空集合 X X X 中有两个元素 x , y x,y x,y,任意一对 x , y x,y x,y 都有一个实数作为距离与其对应,我们把这个实数记为 d ( x , y ) d(x,y) d(x,y) ,它满足:
如果在一个集合上能完成上述定义,那么我们称 d ( x , y ) d(x,y) d(x,y)是 x x x 和 y y y 的距离,称 X X X 是以 d d d 为距离的距离空间。
通常,我们定义n维向量空间 R n R_n Rn 中两个元素 x = [ ξ i ] i = 1 n x = [\xi_i]_{i=1}^n x=[ξi]i=1n, y = [ η i ] i = 1 n y = [\eta_i]_{i=1}^n y=[ηi]i=1n 的距离定义为:
d 2 ( x , y ) = [ ∑ i = 1 n ∣ ξ i − η i ∣ 2 ] 1 / 2 d_2(x,y) = [\sum_{i=1}^n |\xi_i-\eta_i|^2]^{1/2} d2(x,y)=[i=1∑n∣ξi−ηi∣2]1/2
有了距离就可以定义极限,序列 a n a_n an的极限是 a a a, 就可以表示为:
l i m n → ∞ d ( a n , a ) = 0 lim_{n \to \infty}d(a_n,a)=0 limn→∞d(an,a)=0
范数就是将集合中的每一个元素都对应到实数轴上的一个数(不要求一一对应),用来表示元素之间的绝对大小,这种对应关系的运算用 ∣ ∣ ⋅ ∣ ∣ || \cdot || ∣∣⋅∣∣ 表示。当然,如同距离的定义范数的定义也需要满足一些约束:
设 E E E 为线性空间,如果对于 E E E 中任意一个元素 x x x ,都对应一个实数,记为 ∣ ∣ x ∣ ∣ ||x|| ∣∣x∣∣, 且满足:
n维向量的空间中,L2范数可以定义为:
∣ ∣ x ∣ ∣ 2 = { ∑ i = 1 n ∣ ξ i ∣ 2 } 1 / 2 ||x||_2 = \{\sum _{i=1}^n |\xi_i|^2\}^{1/2} ∣∣x∣∣2={i=1∑n∣ξi∣2}1/2
定理:在任意有限维线性赋范空间中,任何范数都是等价的。
此处不给出证明,直观理解这句话的意思就是,任何范数的定义方式都不会改变两个元素的相对大小关系,只是在实数轴上做拉伸或收缩。
完备的线性赋范空间就是巴拿赫空间。解释一下完备,我们定义了距离和范数之后就可以定义极限,有时候一个序列(柯西序列)的极限并不在这个集合当中,比如在集合 ( 0 , 1 ) (0,1) (0,1) 中的序列 1 n , n = 1 , 2 , 3 , . . . \frac{1}{n}, n=1,2,3,... n1,n=1,2,3,...,n趋于无穷大时,这个序列的极限是0,但0并不在集合 ( 0 , 1 ) (0,1) (0,1) 中,此时,我们特别地将0加入集合,使集合变为 [ 0 , 1 ) [0,1) [0,1), 那么我们就完成了一个完备化操作。而巴拿赫空间就是指空间中所有柯西序列都收敛于该空间中的元素。
显然,N维向量空间是一个巴拿赫空间,
内积是用来研究两个元素之间关系的,内积是空间中两个元素经过一定运算后所对应的一个实数,记作: ( x , y ) (x,y) (x,y)。如同距离和范数的定义,内积的定义也需要满足一些性质。
设 E E E 为实线性空间,如果对于 E E E中任意两个元素 x x x 和 y y y ,定义其内积为 ( x , y ) (x,y) (x,y) ,它满足:
N维向量空间 R n R_n Rn中任意两个矢量 x = [ ξ 1 , ξ 2 , . . . , ξ n ] T x=[\xi_1, \xi_2,...,\xi_n]^T x=[ξ1,ξ2,...,ξn]T 和 y = [ η 1 , η 2 , . . . , η n ] T y = [\eta_1,\eta_2,...,\eta_n]^T y=[η1,η2,...,ηn]T的内积可定义为:
( x , y ) = ∑ i = 1 n ξ i η i = x T y (x,y) = \sum_{i=1}^{n} \xi_i \eta_i = x^T y (x,y)=i=1∑nξiηi=xTy
使用内积定义范数:
∣ ∣ x ∣ ∣ = ( x , x ) ||x||=\sqrt{(x,x)} ∣∣x∣∣=(x,x)
在内积空间中,使用上述方式定义范数,且完备(见巴拿赫空间)的空间,称为希尔伯特空间。
N维向量空间是希尔伯特空间。
=============================================================
了解什么是空间之后,我们尝试描述空间之间的关系,引入“算子”。
算子是联系两个空间中元素的一种运算。
定义:设 X X X 和 Y Y Y 是两个给定的线性赋范空间,集合 D ⊂ X \mathcal{D} \subset X D⊂X。若对于 D \mathcal{D} D 中每一个元素 x x x, 均对应于 Y Y Y 中一个确定的元素 y y y, 就说这种对应关系确定了一个算子,通常用大写字母记作 T , A , . . . T, A, ... T,A,...,记为 y = T x y=Tx y=Tx 或 y = T ( x ) y=T(x) y=T(x)。 y y y 称为 x x x 的象, x x x 称为 y y y 的原象。集合 D \mathcal{D} D称为算子 T T T 的定义域,记作 D ( T ) \mathcal{D}(T) D(T),而集合:
R ( T ) = { y ∈ Y ; y = T x , x ∈ D ( T ) } \mathcal{R}(T)=\{y \in Y; y = Tx, x \in \mathcal{D}(T)\} R(T)={y∈Y;y=Tx,x∈D(T)}
称为算子 T T T 的值域。
显然,算子是函数概念的一种推广。
比如一个n维向量 x = [ x 1 , x 2 , . . . , x n ] T x = [x_1, x_2, ...,x_n]^T x=[x1,x2,...,xn]T 要转化为一个m维向量 y = [ y 1 , y 2 , . . . , y m ] T y = [y_1, y_2,...,y_m]^T y=[y1,y2,...,ym]T,可以通过乘以一个m*n维的矩阵 A A A,进行转化:
y = A x y = Ax y=Ax矩阵A就是算子。
当一个算子 T T T 满足:
则称 T T T 是一个线性算子。
通俗的说,算子 T T T 的象的范数不会是无穷大,则算子是有界的。
定义: 如果存在正常数 M M M,使得对每一 x ∈ D ( T ) x \in \mathcal{D}(T) x∈D(T),均有:
∣ ∣ T x ∣ ∣ Y ≤ M ∣ ∣ x ∣ ∣ X ||Tx||_Y \le M||x||_X ∣∣Tx∣∣Y≤M∣∣x∣∣X则称算子 T : X ↦ Y T: X \mapsto Y T:X↦Y 是有界的。
通俗的说,如果原象连续,经过算子 T T T 转化后,象也连续,那么算子是连续的。
定义:设 T : X ↦ Y T: X \mapsto Y T:X↦Y , T T T 在 x 0 ∈ X x_0 \in X x0∈X 的邻域内有定义,假如当 ∣ ∣ x n − x 0 ∣ ∣ → 0 ||x_n-x_0|| \to 0 ∣∣xn−x0∣∣→0
时 ( n → ∞ n \to \infty n→∞)有 ∣ ∣ T x n − T x 0 ∣ ∣ → 0 ( n → ∞ ) ||Tx_n-Tx_0|| \to 0 (n \to \infty) ∣∣Txn−Tx0∣∣→0(n→∞), 则称算子 T T T 在 x 0 x_0 x0处是连续的,如果 T T T 在 D ( T ) \mathcal{D}(T) D(T)的每一点处都连续,则称 T T T 是连续算子。
定理:线性算子如果在某一点连续,则在定义域内处处连续。(证明略)
先给出定义再解释:
定义:设 T : X ↦ Y T: X \mapsto Y T:X↦Y为有界线性算子,则对于一切 x ∈ D ( T ) x \in \mathcal{D}(T) x∈D(T),使得不等式 ∣ ∣ T x ∣ ∣ Y ≤ M ∣ ∣ x ∣ ∣ X ||Tx||_Y \le M||x||_X ∣∣Tx∣∣Y≤M∣∣x∣∣X成立的所有正数M的下确界,称为算子 T T T 的范数。
如何理解?
范数可以理解为大小,一个元素的范数就是一个元素的大小,一个算子的范数就是这个算子最多能把元素放大多少倍。我们求一个算子的范数的时候,固定算子T,然后变换 x ∈ X x \in X x∈X, 得到了所有对应的 y ∈ Y ( y = T x ) y \in Y (y = Tx) y∈Y(y=Tx), 我们计算每一对 x , y x,y x,y 的范数的放大倍数: ∣ ∣ y ∣ ∣ Y ∣ ∣ x ∣ ∣ X \frac{||y||_{Y}}{||x||_X} ∣∣x∣∣X∣∣y∣∣Y 这个序列的最大值或者它的极限(比它大的),称为算子的范数。
定理:设 T : X ↦ Y T: X \mapsto Y T:X↦Y为有界线性算子,则 ∣ ∣ T ∣ ∣ = s u p ∣ ∣ x ∣ ∣ = 1 ∣ ∣ T x ∣ ∣ = s u p x ≠ θ ∣ ∣ T x ∣ ∣ ∣ ∣ x ∣ ∣ = s u p ∣ ∣ x ∣ ∣ ≤ 1 ∣ ∣ T x ∣ ∣ ||T|| = sup_{||x||=1}||Tx|| = sup_{x \ne \theta} \frac{||Tx||}{||x||} = sup_{||x|| \le 1}||Tx|| ∣∣T∣∣=sup∣∣x∣∣=1∣∣Tx∣∣=supx=θ∣∣x∣∣∣∣Tx∣∣=sup∣∣x∣∣≤1∣∣Tx∣∣ (证明略)
m*n矩阵A是连接两个欧氏空间 E n , E m E_n, E_m En,Em 的有界线性算子。则它的范数为:
∣ ∣ A ∣ ∣ = s u p ∣ ∣ x ∣ ∣ = 1 ∣ ∣ A x ∣ ∣ = m a x ∣ ∣ x ∣ ∣ = 1 x T A T A x = m a x ∣ ∣ x ∣ ∣ = 1 λ x T x = λ m a x ||A|| = sup_{||x||=1}||Ax|| = max_{||x||=1} \sqrt{x^TA^TAx} = max_{||x||=1} \sqrt{\lambda x^Tx} = \sqrt{\lambda_{max}} ∣∣A∣∣=sup∣∣x∣∣=1∣∣Ax∣∣=max∣∣x∣∣=1xTATAx=max∣∣x∣∣=1λxTx=λmax 其中, λ m a x \lambda_{max} λmax为矩阵 A T A A^TA ATA的最大特征值。
了解完单个算子,我们来考察连接 X , Y X,Y X,Y 两个空间的有界线性算子的全体, 记作 L ( X , Y ) \mathcal{L}(X,Y) L(X,Y)。由于上面已经定义了算子的范数,且满足范数的三条公理(证明略),所以这样的算子空间已经可以成为一个线性赋范空间。
定理:设 X X X 为线性赋范空间,而 Y Y Y 为巴拿赫空间,则 L ( X , Y ) \mathcal{L}(X,Y) L(X,Y) 是巴拿赫空间。(证明略)
我们定义了算子的范数后,就容易定义算子的依范数收敛,具体如下:
设 { T n } \{T_n\} {Tn} 是 L ( X , Y ) L(X,Y) L(X,Y) 中的基本列, 即任意小的数 ϵ > 0 \epsilon > 0 ϵ>0, 存在自然数 N N N ,使得当 n > N n>N n>N 是对任何自然数 p p p 有, ∣ ∣ T n + p − T n ∣ ∣ < ϵ ||T_{n+p}-T_{n}||<\epsilon ∣∣Tn+p−Tn∣∣<ϵ
而另一种收敛,强收敛的定义如下:
设 { T n } ⊂ L ( X , Y ) , T ∈ L ( X , Y ) \{T_n\} \subset \mathcal{L}(X,Y), T\in \mathcal{L}(X,Y) {Tn}⊂L(X,Y),T∈L(X,Y), 如果对于任一 x ∈ X x\in X x∈X, 均有 ∣ ∣ T n x − T x ∣ ∣ → 0 ||T_n x-Tx|| \to 0 ∣∣Tnx−Tx∣∣→0, 则称算子序列 T n {T_n} Tn 强收敛于算子 T T T。
我们希望找到一个空间 X X X到空间 Y Y Y 的目标算子 T T T,那么我们就希望通过一个算子序列 T n {T_n} Tn 来逼近算子T,这种逼近就是强收敛。
强收敛有一些性质,本文不介绍,请读者拓展阅读。
值域为数域(实数域或复数域)的算子称为泛函。
为了简单我们只研究实数域。
通俗的说,如果某个算子能将一个空间映射到实数轴上,那么这个算子就是一个泛函。
比如,定积分运算,将函数空间映射到实数域。
又比如,内积运算,将n维向量空间映射到实数域。
值域为数域(实数域或复数域)的有界线性算子称为有界线性泛函。
定义在整个线性赋范空间 X X X 上的所有有界线性泛函所构成的空间 L ( X , R 1 ) \mathcal{L}(X,R_1) L(X,R1) 称为空间 X X X 的共轭空间(对偶空间),记作 X ∗ X^* X∗。
下面介绍两个共轭空间:
线性赋范空间 X X X中有界线性泛函的几何意义:它确定了 X X X中的一个闭超平面。超平面是由泛函来确定的。
以N维欧氏空间为例, f ( x ) = ∑ i = 1 n ξ i η i f(x) =\sum_{i=1}^n \xi_i \eta_i f(x)=∑i=1nξiηi, f ( x ) = d f(x)=d f(x)=d 确定了一个超平面。
在3维空间中,任何二维平面是超平面,而直线不是超平面。
空间 X X X 的共轭空间是 X ∗ X^* X∗,这是一个巴拿赫空间(证明略),那么它的共轭空间,我们记作 X ∗ ∗ X^{**} X∗∗,即二次共轭空间。
定义 :设 X X X是线性赋范空间, { x n } ⊂ X , x 0 ∈ X \{x_n\} \subset X, x_0 \in X {xn}⊂X,x0∈X, 如果对于每一个 f ∈ X ∗ f \in X^* f∈X∗, 均有 l i m n → ∞ f ( x n ) = f ( x 0 ) lim_{n \to \infty} f(x_n)=f(x_0) limn→∞f(xn)=f(x0), 则称序列 x n {x_n} xn 弱收敛于 x 0 x_0 x0, 并记为 x n ⟶ 弱 x 0 x_n\stackrel{弱}{\longrightarrow} x_0 xn⟶弱x0 。
弱收敛是一种比依范数收敛弱的条件,即依范数收敛可以推出弱收敛,弱收敛不能推出依范数收敛。
定义:设 X X X为线性赋范空间, { f n } ⊂ X ∗ , f 0 ∈ X ∗ \{f_n\} \subset X^*, f_0 \in X^* {fn}⊂X∗,f0∈X∗,如果对于每一个 x ∈ X x \in X x∈X均有, f n ( x ) → f 0 ( x ) f_n(x) \to f_0(x) fn(x)→f0(x),则称泛函序列 f n f_n fn弱*收敛于泛函 f 0 f_0 f0,记为 f n ⟶ 弱 f 0 f_n \stackrel{弱}{\longrightarrow} f_0 fn⟶弱f0
细心的读者可以注意到泛函序列的弱收敛和算子序列的强收敛定义相同。
如果 x ∈ X x \in X x∈X 及 f i n X ∗ f \ in X^* f inX∗ 满足 f ( x ) = < x , f > = ∣ ∣ f ∣ ∣ ∣ ∣ x ∣ ∣ f(x) =
如果 < x , f > = 0
通俗的说,线性赋范空间 X , Y X,Y X,Y, X → Y X \to Y X→Y的算子为 A A A,而 X , Y X,Y X,Y对应的泛函空间分别为 X ∗ , Y ∗ X^*,Y^* X∗,Y∗,则 Y ∗ → X ∗ Y^* \to X^* Y∗→X∗ 的算子 A ∗ A^* A∗ 就是 A A A的共轭算子。
且 ∣ ∣ A ∗ ∣ ∣ = ∣ ∣ A ∣ ∣ ||A^*||=||A|| ∣∣A∗∣∣=∣∣A∣∣
例如, X X X为n维欧氏空间, Y Y Y 为m维欧氏空间, A = L ( X , Y ) A = \mathcal{L} (X,Y) A=L(X,Y),则对应的 A ∗ A^* A∗为 A A A的转置
考虑希尔伯特空间中的算子 A A A,其共轭算子由下式确定: ( A x , y ) = ( x , A ∗ y ) (Ax,y)=(x,A^*y) (Ax,y)=(x,A∗y),如果 A ∗ = A A^*=A A∗=A,则称A式自共轭算子(或自伴算子)
在上一个例子中,如果 A A A是n*n阶对称矩阵,则 A A A是自共轭算子.
下面进入非线性泛函
设 X X X为线性赋范空间, x 0 ∈ X x_0 \in X x0∈X, f ( x ) f(x) f(x)是在 x 0 x_0 x0及其邻域内有定义的泛函,一般非线性,如果对于任意的 h ∈ X h \in X h∈X 极限 lim t → 0 f ( x 0 + t h ) − f ( x 0 ) t \lim_{t \to 0} \frac{f(x_0+th)-f(x_0)}{t} t→0limtf(x0+th)−f(x0)存在,记为 δ f ( x 0 ; h ) \delta f(x_0;h) δf(x0;h), 则称之为泛函 f ( x ) f(x) f(x)在 x 0 x_0 x0处关于增量h的一阶变分。
在一阶变分的定义中如果 δ f ( x 0 ; h ) \delta f(x_0;h) δf(x0;h)是关于 h h h的有界线性泛函,记为 f ′ ( x 0 ) f'(x_0) f′(x0): δ f ( x 0 ; h ) = < h , f ′ ( x 0 ) > \delta f(x_0;h)=
加脱微分推广了微积分中的方向导数和梯度的概念。
设 X , Y X,Y X,Y是巴拿赫空间,算子 F : X → Y F:X \to Y F:X→Y(一般F是非线性的),如果存在有界线性算子 A ∈ L ( X , Y ) A \in \mathcal{L}(X,Y) A∈L(X,Y)使得关系式: lim t → 0 F ( x 0 + t h ) − F ( x 0 ) t = A h \lim_{t \to 0}\frac{F(x_0+th)-F(x_0)}{t}=Ah t→0limtF(x0+th)−F(x0)=Ah对于满足 ∣ ∣ h ∣ ∣ = 1 ||h||=1 ∣∣h∣∣=1 的 h ∈ X h \in X h∈X 一致地成立的,则称算子 F F F 在点 x 0 x_0 x0处是费力许可微的。
表达式: d F ( x 0 ; h ) = F ′ ( x 0 ) h dF(x_0;h)=F'(x_0) h dF(x0;h)=F′(x0)h称为算子 F F F在店 x 0 x_0 x0处关于增量 h h h的费力许微分。
费力许可微是全微分的推广形式。
设算子 F : X → Y F: X \to Y F:X→Y在点 x 0 x_0 x0的邻域 S S S内连续可微,则在 S S S内成立一下有限增量公式: F ( x 0 + h ) − F ( x 0 ) = ( ∫ 0 1 F ′ ( x 0 + t h ) d t ) h , x 0 + h ∈ S F(x_0+h)-F(x_0)=(\int_0^1 F'(x_0+th)dt)h,x_0+h \in S F(x0+h)−F(x0)=(∫01F′(x0+th)dt)h,x0+h∈S