函数空间一览:从线性空间到再生核希尔伯特空间

文章目录

  • 0. 基础概念
    • 0.1 代数系统
    • 0.2 数域
    • 0.3 完备的空间
  • 1. 线性空间/向量空间
  • 2. 度量空间
  • 3. 赋范向量空间
  • 4. 内积空间
  • 5. 巴拿赫空间
  • 6. 希尔伯特空间
  • 7. 再生核希尔伯特空间
  • 8. 总结

0. 基础概念

  • 常见的各种函数空间本质都是定义在数域上的特殊代数系统,先补充基础概念

0.1 代数系统

  • 代数系统是一个定义了一些运算和一些规则集合,其中包含
    1. 一组给定元素(element)组成集合(这个集合是代数系统的本体,元素可以是任何东西:数、函数、矩阵…)
    2. 一组 well define 的运算(operation)(well define 指运算的结果一定是唯一的,即所有 operation 都是合法的函数映射)
    3. 运算的计算规则(rules of operation)(可以用来进行推理)

0.2 数域

  • 数域 F F F是至少包含 0 0 0 1 1 1 的一组数,并且在加、减、乘、除下是封闭的,即满足以下性质:
    ∀ a ∈ F , − a ∈ F ∀ b ∈ F , b ≠ 0 , b − 1 ∈ F ∀ a , b ∈ F , a + b ∈ F , ∀ a , b ∈ F , a ⋅ b ∈ F \begin{aligned} &\forall a \in F, &&-a\in F \\ &\forall b \in F, b\neq 0, &&b^{-1} \in F \\ &\forall a,b \in F, &&a+b\in F, \\ &\forall a,b \in F, &&a·b\in F \end{aligned} aF,bF,b=0,a,bF,a,bF,aFb1Fa+bF,abF

0.3 完备的空间

  • 粗略但是直观的说,完备是指空间中没有任何遗漏的点。所谓 “没有遗漏” 需要用 “距离” 来理解。以实数空间 R \mathbb{R} R 为例,其中距离定义为两元素差的绝对值,这时 “没有任何遗漏的点” 就是说任何一个点在与它距离趋近为 0 的地方都存在一个点,并且这个点是 R \mathbb{R} R 中的,可见实数空间是完备的
  • 形式化一点定义,一个空间是完备的当且仅当空间中的任何柯西序列都收敛在该空间之内柯西序列是指一个这样一个序列,它的元素随着序数的增加而愈发靠近,如下图所示
    函数空间一览:从线性空间到再生核希尔伯特空间_第1张图片
  • 如果一个空间是完备的,则它对极限操作封闭,这是空间完备性的主要意义

1. 线性空间/向量空间

  • 线性空间linear space:定义在数域 F F F 上的代数系统 V ≠ ∅ V\neq \empty V=加法(addition)数乘(scalar multiplication) 两个 operation,如果 V V V 含有零元、负元、幺元等特殊元素;operation 都封闭的且满足八条运算规则,则该代数系统称为线性空间。具体而言,要求
    1. closure properties(封闭性):
      1. ∀ α , β ∈ V , α + β ∈ V \forall \alpha,\beta \in \pmb{V}, \alpha+\beta \in \pmb{V} α,βVV,α+βVV is unique
      2. ∀ k ∈ F , α ∈ V ,   k ⋅ α ∈ V \forall k \in \pmb{F}, \alpha\in \pmb{V},\space k·\alpha\in \pmb{V} kFF,αVV, kαVV is unique
      函数空间一览:从线性空间到再生核希尔伯特空间_第2张图片

      说明:这里的加法运算 addition 没有什么要求,可以定义任意 V \pmb{V} VV 上的运算作为 “addition”,但是数乘运算 scalar multiplication 要求必须是从数域 F \pmb{F} FF 中取一个数和 V \pmb{V} VV 中元素做数乘,Linear space V \pmb{V} VV over a filed F \pmb{F} FF 指的就是这个。封闭性要求这两个运算的结果都在 V \pmb{V} VV

    2. The addition axioms(加法公理):
      函数空间一览:从线性空间到再生核希尔伯特空间_第3张图片

    3. The scalar multiplication axioms(乘法公理):
      函数空间一览:从线性空间到再生核希尔伯特空间_第4张图片

    4. 特殊元素:

      元素 性质
      加法零元 (zero element) 0 ∈ V \pmb{0} \in \pmb{V} 00VV ∀ α ∈ V ,   0 + α = α \forall \alpha \in \pmb{V}, \space \pmb{0}+\alpha = \alpha αVV, 00+α=α
      加法负元 (additive inverse) − α ∈ V -\alpha \in \pmb{V} αVV ∀ α ∈ V \forall \alpha \in \pmb{V} αVV ∃ − α ∈ V \exists -\alpha\in\pmb{V} αVV,S.t. α + ( − α ) = 0 \alpha+(-\alpha) = \pmb{0} α+(α)=00
      乘法幺元 (unit element) 1 ∈ F 1 \in \pmb{F} 1FF ∀ α ∈ V ,   1 ⋅ α = α \forall \alpha \in \pmb{V}, \space 1·\alpha = \alpha αVV, 1α=α
  • 注意上面定义的运算就是一般所说的 线性运算(加法+数乘,就是线性代数里那种 “线性”),注意下面的逻辑
    1. 利用线性运算,可以得到对于集合元素线性表示线性相关/无关等概念
    2. 进一步能定义出关于集合元素维数坐标等概念
    3. 任意给定一组基,线性空间 V V V 中的所有元素都能和其坐标一一对应,这等价于一个把所有元素替换为其坐标的新线性空间。也就是说,无论线性空间中的元素是什么(数、函数、矩阵…),都能将其等价地变化为一个以 “数的向量” 为元素的线性空间,因此线性空间linear space也称为向量空间vector space,这两个是一回事

2. 度量空间

  • 度量空间metric space:是定义了距离operation的集合:设 V V V 是任意集合,定义 距离 为函数 d ( x , y ) : V × V → R d(x,y): V\times V\to \mathbb{R} d(x,y):V×VR ∀ x , y ∈ V \forall x,y \in V x,yV 满足
    正定性: d ( x , y ) ≥ 0  且  d ( x , y ) = 0 ⇔ x = y 对称性: d ( x , y ) = d ( y , x ) 三角不等式: d ( x , y ) ≤ d ( x , z ) + d ( z , y ) \begin{aligned} 正定性:&d(x, y) \geq 0 \space且\space d(x, y)=0 \Leftrightarrow x=y\\ 对称性:&d(x, y)=d(y, x) \\ 三角不等式:&d(x, y) \leq d(x, z)+d(z, y) \end{aligned} 正定性:对称性:三角不等式:d(x,y)0  d(x,y)=0x=yd(x,y)=d(y,x)d(x,y)d(x,z)+d(z,y)
    1. 定义了距离的线性空间称为 线性度量空间
  • 直观上看,度量空间是定义了 “元素间距离” 概念的集合

3. 赋范向量空间

  • 赋范向量空间Normed vector space是定义了范数operation的向量空间:设 V V V 是数域 F F F 上的线性空间,定义范数为函数 ∣ ∣ ⋅ ∣ ∣ : V → R ||·||: V\to \mathbb{R} ∣∣∣∣:VR ∀ x , y ∈ V , ∀ a ∈ F \forall x,y \in V, \forall a\in F x,yV,aF 满足
    正定性: ∣ ∣ x ∣ ∣ ≥ 0  且  ∣ ∣ x ∣ ∣ = 0 ⇔ x = 0 三角不等式: ∣ ∣ x + y ∣ ∣ ≤ ∣ ∣ x ∣ ∣ + ∣ ∣ y ∣ ∣ 正齐次性: ∣ ∣ a x ∣ ∣ = ∣ a ∣ ∣ ⋅ ∣ x ∣ ∣ \begin{aligned} 正定性:&||x|| \geq 0 \space且\space ||x|| =0 \Leftrightarrow x=\pmb{0}\\ 三角不等式:&||x+y|| \leq ||x||+||y|| \\ 正齐次性:&||ax|| = |a||·|x|| \end{aligned} 正定性:三角不等式:正齐次性:∣∣x∣∣0  ∣∣x∣∣=0x=00∣∣x+y∣∣∣∣x∣∣+∣∣y∣∣∣∣ax∣∣=a∣∣x∣∣
    1. 从范数的定义中可见数乘 a x a x ax 和加法 x + y x+y x+y 都封闭,因此赋范向量空间一定是特殊的线性空间
    2. 可以用范数定义距离: d ( x , y ) : = ∣ ∣ x − y ∣ ∣ d(x,y) := ||x-y|| d(x,y):=∣∣xy∣∣,因此赋范向量空间都可以(定义距离后)成为度量空间
    3. 具有完备性的赋范向量空间称为巴拿赫空间
  • 直观上看,赋范向量空间是定义了 “元素自身长度” 概念的向量空间

4. 内积空间

  • 内积空间Inner product space是定义了内积operation的向量空间:设 V V V 是数域 F F F 上的线性空间,定义 内积 为函数 ( x , y ) : V × V → R (x,y): V\times V\to \mathbb{R} (x,y):V×VR ∀ x , y , z ∈ V , ∀ a ∈ F \forall x,y,z \in V, \forall a\in F x,y,zV,aF 满足
    对称性: ( x , y ) = ( y , x ) 可加性: ( x + y , z ) = ( x , z ) + ( y , z ) 齐次性: ( a x , y ) = a ( x , y ) 正定性: ( x , x ) ≥ 0  且  ( x , x ) = 0 ⇔ x = 0 \begin{aligned} &对称性:(x, y)=(y, x) \\ &可加性:(x+y, z)=(x, z)+(y, z) \\ &齐次性:(a x, y)=a(x, y) \\ &正定性:(x, x) \geq 0 \text { 且 }(x, x)=0 \Leftrightarrow x=\mathbf{0} \end{aligned} 对称性:(x,y)=(y,x)可加性:(x+y,z)=(x,z)+(y,z)齐次性:(ax,y)=a(x,y)正定性:(x,x)0  (x,x)=0x=0
    1. 从内积的定义中可见数乘 a x a x ax 和加法 x + y x+y x+y 都封闭,因此内积空间一定是特殊的线性空间
    2. 可以用内积定义范数: ∣ ∣ x ∣ ∣ : = ( x , x ) ||x|| := \sqrt{(x,x)} ∣∣x∣∣:=(x,x) ,因此内积空间都可以(定义范数后)成为赋范向量空间
    3. 利用内积可在空间中建立欧几里得几何学,例如交角、垂直和投影等,故习惯上称二维或三维的内积空间为欧几里得空间,内积空间是欧几里得空间的一般化
    4. 具有完备性的内积空间称为希尔伯特空间
  • 直观上看,内积空间是定义了 “元素间夹角” 概念的向量空间

5. 巴拿赫空间

  • 巴拿赫空间Banach space 是完备的赋范向量空间,具体而言,巴拿赫空间对其范数诱导的距离度量是完备的

6. 希尔伯特空间

  • 希尔伯特空间Hilbert space是完备的内积空间,具体而言
    1. 希尔伯特空间中内积诱导的范数构成一个巴拿赫空间
    2. 即希尔伯特空间对这个 “内积诱导的范数” 所诱导的距离度量是完备的(巴拿赫空间定义)
  • 希尔伯特空间是一个函数空间,即空间中每个元素都是一个函数,完备意味着对这些函数取极限后还在空间内

    Note:离散函数可以看做有限维向量;连续函数可以看做无限维向量

7. 再生核希尔伯特空间

  • 这里涉及到 SVM 中常用的核函数,核函数的想法简单说就是
    1. 考虑分类问题,根据 Cover 定理,将数据映射到越高维度的空间,就越容易找出线性分离超平面将其线性分类。这样就能用合适的映射函数 ϕ ( x ) \phi(x) ϕ(x) 将输入空间中的样本 x x x 映射到高维特征空间,再用线性 SVM 分类器进行分类
    2. 求解线性 SVM 对偶问题时,会发现最终的分离超平面和判别函数都只涉及输入样本特征向量之间的内积,而计算大量形如 ϕ ( x i ) T ϕ ( x j ) \phi(x_i)^T\phi(x_j) ϕ(xi)Tϕ(xj) 的高维内积复杂度太高
    3. 所谓核函数,就是一个无穷维的二维函数,直接满足 K ( x , z ) = ϕ ( x ) T ϕ ( z ) K(x,z) = \phi(x)^T\phi(z) K(x,z)=ϕ(x)Tϕ(z)
  • 利用核函数可以大幅降低计算复杂度,但是正向找出合适的映射函数 ϕ \phi ϕ 来构成 K K K 很困难,我们通常会根据判定核函数的充分条件直接得到符合定义的核函数 K K K,确定核 K K K 后,我们就能用一定的方法构造出它对应的一组映射函数 ϕ \phi ϕ 和它映射到的希尔伯特空间 H \mathcal{H} H,核 K K K 在空间 H \mathcal{H} H 中具有 “再生性”,即有
    ⟨ K ( ⋅ , x ) , K ( ⋅ , z ) ⟩ = K ( x , z ) \langle K(\cdot,x),K(\cdot,z)\rangle = K(x,z) K(,x),K(,z)⟩=K(x,z) 因此这个 H \mathcal{H} H 称为 “再生核希尔伯特空间”
  • 一句话说,再生核希尔伯特空间是由给定核函数根据一定方式构造出的希尔伯特空间,详细说明请参考 经典机器学习方法(6)—— 非线性支持向量机器与核技巧 1.2 节

8. 总结

  • 总结一下上面说的所有空间
    函数空间一览:从线性空间到再生核希尔伯特空间_第5张图片
    1. 线性空间 = 定义了加法和数乘操作的集合,满足封闭性和8条性质
    2. 度量空间 = 定义了距离操作的集合
    3. 赋范向量空间 = 范数 + 线性空间(范数可以诱导度量)
    4. 内积空间 = 内积 + 线性空间(内积可以诱导范数)
    5. 欧几里得空间 = 二维或三维的内积空间
    6. 巴拿赫空间 = 完备 + 赋范向量空间
    7. 希尔伯特空间 = 完备 + 内积空间
    8. 再生核希尔伯特空间 = 从核函数构造出的希尔伯特空间

你可能感兴趣的:(数学,算法,机器学习,python)