范数是用来衡量向量或者矩阵的大小的,比如初高中教育讲的向量的模也相当于范数的一种。
向量的范数并不像模一样有唯一的计算,范数是一个笼统的概念,它是指满足下面三个条件的以n阶向量作为参数的实值函数 ∣ ∣ . ∣ ∣ ||.|| ∣∣.∣∣:
非负性
对任何向量 x ∈ R n x\in R^n x∈Rn, ∣ ∣ x ∣ ∣ ≥ 0 ||x||\ge0 ∣∣x∣∣≥0,且 ∣ ∣ x ∣ ∣ = 0 ||x||=0 ∣∣x∣∣=0当且仅当 x = 0 x=0 x=0
齐次性
对任何实数 α \alpha α和向量 x ∈ R n x\in R^n x∈Rn, ∣ ∣ α x ∣ ∣ = ∣ α ∣ ∣ ∣ x ∣ ∣ ||\alpha x||=|\alpha|\space||x|| ∣∣αx∣∣=∣α∣ ∣∣x∣∣
三角不等式
对任何向量 x , y ∈ R n x,y\in R^n x,y∈Rn, ∣ ∣ x + y ∣ ∣ ≤ ∣ ∣ x ∣ ∣ + ∣ ∣ y ∣ ∣ ||x+y||\le||x||+||y|| ∣∣x+y∣∣≤∣∣x∣∣+∣∣y∣∣
满足条件的范数,同时还具有等价性:
对于 R n R^n Rn上的任何两种向量范数 ∣ ∣ . ∣ ∣ α ||.||_\alpha ∣∣.∣∣α和 ∣ ∣ . ∣ ∣ β ||.||_\beta ∣∣.∣∣β,存在常数 m , M m,M m,M是的下面不等式成立:
m ∣ ∣ x ∣ ∣ β ≤ ∣ ∣ x ∣ ∣ α ≤ M ∣ ∣ x ∣ ∣ β m||x||_\beta\le||x||_\alpha\le M||x||_\beta m∣∣x∣∣β≤∣∣x∣∣α≤M∣∣x∣∣β
虽然说,范数的定义说明理论上存在很多种范数,但是最常用的也就下面几种:
∣ ∣ x ∣ ∣ 1 = ∑ i = 1 n ∣ x i ∣ ||x||_1=\sum_{i=1}^{n}|x_i| ∣∣x∣∣1=i=1∑n∣xi∣
∣ ∣ x ∣ ∣ 2 = ( ∑ i = 1 n x i 2 ) 1 2 ||x||_2 = (\sum_{i=1}^{n}x_i^2)^\frac{1}{2} ∣∣x∣∣2=(i=1∑nxi2)21
∣ ∣ x ∣ ∣ ∞ = m a x 1 ≤ i ≤ n ∣ x i ∣ ||x||_\infty=max_{1\le i\le n}|x_i| ∣∣x∣∣∞=max1≤i≤n∣xi∣
类似于数列收敛,使用范数可以定义向量序列的收敛:
设向量序列 x ( k ) = ( x 1 ( k ) , x 2 ( k ) , . . . , x n ( k ) ) T , k = 0 , 1 , . . . , x^{(k)}=(x_1^{(k)},x_2^{(k)},...,x_n^{(k)})^T, k=0,1,..., x(k)=(x1(k),x2(k),...,xn(k))T,k=0,1,...,,向量 x ∗ = ( x 1 ∗ , x 2 ∗ , . . . , x n ∗ ) T x^*=(x_1^*,x_2^*,...,x_n^*)^T x∗=(x1∗,x2∗,...,xn∗)T。如果:
l i m k → ∞ ∣ ∣ x ( k ) − x ∗ ∣ ∣ = 0 lim_{k\to\infty}||x^{(k)}-x^*|| = 0 limk→∞∣∣x(k)−x∗∣∣=0
则该向量序列收敛到向量 x ∗ x^* x∗,记做 l i m k → ∞ x ( k ) = x ∗ lim_{k\to\infty}x^{(k)}=x^* limk→∞x(k)=x∗或 x ( k ) → x ∗ x^{(k)}\to x^* x(k)→x∗
矩阵范数类似向量范数,是以n阶矩阵为参数的满足下面条件的实值函数:
∣ ∣ A ∣ ∣ 1 = m a x 1 ≤ j ≤ n ∑ i = 1 n ∣ a i j ∣ ||A||_1=max_{1\le j\le n}\sum_{i=1}^n|a_{ij}| ∣∣A∣∣1=max1≤j≤ni=1∑n∣aij∣
∣ ∣ A ∣ ∣ 2 = ( A T A 的 最 大 特 征 值 ) 1 2 ||A||_2=(A^TA的最大特征值)^\frac{1}{2} ∣∣A∣∣2=(ATA的最大特征值)21
∣ ∣ A ∣ ∣ ∞ = m a x 1 ≤ i ≤ n ∑ j = 1 n ∣ a i j ∣ ||A||\infty=max_{1\le i \le n}\sum_{j=1}^n|a_{ij}| ∣∣A∣∣∞=max1≤i≤nj=1∑n∣aij∣
∣ ∣ A ∣ ∣ = m a x x ≠ 0 ∣ ∣ A x ∣ ∣ ∣ ∣ x ∣ ∣ ||A||=max_{x\space\neq0}\frac{||Ax||}{||x||} ∣∣A∣∣=maxx ̸=0∣∣x∣∣∣∣Ax∣∣
矩阵算子范数都满足:
∣ ∣ A x ∣ ∣ ≤ ∣ ∣ A ∣ ∣ ∣ ∣ x ∣ ∣ , ∀ x ∈ R n ||Ax||\le||A||\space||x||, \forall x\in R^n ∣∣Ax∣∣≤∣∣A∣∣ ∣∣x∣∣,∀x∈Rn
通常满足上面柿子的矩阵范数都称为与向量范数相容的矩阵范数
∣ ∣ A ∣ ∣ F = ( ∑ i , j = 1 n ∣ a i j ∣ 2 ) 1 2 ||A||_F=(\sum_{i,j=1}^n|a_{ij}|^2)^\frac{1}{2} ∣∣A∣∣F=(i,j=1∑n∣aij∣2)21
F范数的特殊性在于:对于任何一个算子范数,单位矩阵的范数均为1,但是F范数的值却是 n \sqrt{n} n,所以F范数不是算子范数,但是他却与向量2-范数相容,也就是满足:
∣ ∣ A x ∣ ∣ ≤ ∣ ∣ A ∣ ∣ F ∣ ∣ x ∣ ∣ 2 ||Ax||\le||A||_F\space||x||_2 ∣∣Ax∣∣≤∣∣A∣∣F ∣∣x∣∣2
类似于数列收敛,使用范数可以定义矩阵序列的收敛:
设矩阵序列 A ( k ) = ( a i j ( k ) ) , k = 1 , 2 , . . . A^{(k)}=(a_{ij}^{(k)}),k=1,2,... A(k)=(aij(k)),k=1,2,...,矩阵 A = ( a i j ) A=(a_{ij}) A=(aij)。如果满足下面条件:
l i m k → ∞ ∣ ∣ A ( k ) − A ∣ ∣ = 0 lim_{k\to\infty}||A^{(k)}-A||=0 limk→∞∣∣A(k)−A∣∣=0
就称 { A ( k ) } \{A^{(k)}\} {A(k)}收敛于 A A A,记做 l i m k → ∞ A ( k ) = A lim_{k\to\infty}A^{(k)}=A limk→∞A(k)=A或 A ( k ) = A A^{(k)}=A A(k)=A
根据F范数可知:
∣ ∣ A ( k ) − A ∣ ∣ F = ( ∑ i , j = 1 n ∣ a i j ( k ) − a i j ) 1 2 ||A^{(k)}-A||_F=(\sum_{i,j=1}^n|a_{ij}^{(k)}-a_{ij})^\frac{1}{2} ∣∣A(k)−A∣∣F=(i,j=1∑n∣aij(k)−aij)21
矩阵序列 A ( k ) = A A^{(k)}=A A(k)=A,当且仅当 a i j ( k ) → a i j , 1 ≤ i , j ≤ n a_{ij}^{(k)}\to a_{ij},1\le i,j\le n aij(k)→aij,1≤i,j≤n