矩阵分析:向量范数,矩阵范数,范数应用

1,向量范数

1.1,向量范数的定义和例子

设 \small \mathbb{C}^n 是复数域上的 \small n 维向量空间,称函数 \small ||\cdot||:\mathbb{C}^n \rightarrow R 为向量范数,是指对所有 \small x,y\in \mathbb{C}^n,有下列性质:

(1)非负性:\small ||x||\geqslant 0,并且 \small ||x||=0 当且仅当 \small x=0

(2)齐次性:对任何 \small \lambda \in \mathbb{C}\small ||\lambda x||=|\lambda|||x||

(3)三角不等式:\small ||x+y||\leqslant ||x||+||y||

若对任意 \small x,y \in \mathbb{C}^n,有:

(1)\small ||0||=0

(2)\small ||-x||=||x||

(3)\small |||x||-||y|||\leqslant ||x-y||

证明(3):根据三角不等式,有:

\small ||x||=||x-y+y||\leqslant ||x-y||+||y||

\small ||y||=||y-x+x||\leqslant ||y-x||+||x||

两式分别相减可得:\small |||x||-||y|||\leqslant ||x-y||

设 \small x=(\xi_1,\xi_2,...,\xi_n)^T\in \mathbb{C}^n,则下列实值函数都是 \small \mathbb{C}^n 上的向量范数:

(1)2范数:\small ||x||_2=\left ( \sum_{k=1}^n|\xi_k|^2 \right )^{\frac{1}{2}}\geqslant 0

(2)1范数:\small ||x||_1=\sum_{k=1}^{n}|\xi_k|

(3)\small \infty范数:\small ||x||_{\infty }=\underset{k}{max }|\xi _k|

(4)p范数:\small ||x||_p=\left ( \sum_{k=1}^n|\xi_k|^p \right )^{\frac{1}{p}}(p\geqslant 1),当 \small p=1,2 时,分别得到向量1范数和2范数,并且可以证明\small \infty范数也是 \small p\rightarrow +\infty 时的特殊情形。 

分别取 \small p=\frac{1}{2},1,2,+\infty,在平面 \small z=(x,y) 上画出 \small ||z||_p=1 表示的图形(对应从内到外):

矩阵分析:向量范数,矩阵范数,范数应用_第1张图片

\small p=1 是图形是否为凸的临界值。\small p<1,图像为凹;\small p>1,图像为凸。

【例1】设 \small x=(1+i,4i,2\sqrt{2}-i,-2\sqrt2)^T,求 \small ||x||_1,||x||_2,||x||_\infty

\small ||x||_1=|1+i|+|4i|+|2\sqrt2-i|+|2\sqrt2|=7+3\sqrt2

\small ||x||_2=\left [ |1+i|^2+|4i|^2+|2\sqrt{2}-i|^2+|-2\sqrt{2}|^2 \right ]^{\frac{1}{2}}=\sqrt{35}

\small ||x||_\infty =max\left \{ |1+i|,|4i|,|2\sqrt{2}-i|,|-2\sqrt{2}| \right \}=4

常用不等式:

(1)柯西-施瓦茨不等式:\small (\sum_{k=1}^na_kb_k)^2\leqslant \sum_{k=1}^na_k^2\sum_{k=1}^nb_k^2

(2)杨氏不等式:\small \alpha \beta \leqslant \frac{1}{p}\alpha ^p+\frac{1}{q}\beta^q,其中 \small \alpha ,\beta >0,p,q>1,且 \small \frac{1}{p}+\frac{1}{q}=1

(3)赫尔德不等式:\small \sum_{k=1}^na_kb_k\leqslant (\sum_{k=1}^na_k^p)^{\frac{1}{p}}(\sum_{k=1}^nb_k^q)^{\frac{1}{q}}\small p,q>1,\frac{1}{p}+\frac{1}{q}=1\small a_k\geqslant 0,b_k\geqslant 0,k=1,2,...,n

(4)闵可夫斯基不等式:\small (\sum_{k=1}^n(a_k+b_k)^p)^{\frac{1}{p}}\leqslant (\sum_{k=1}^{n}a_k^p)^{\frac{1}{p}}+(\sum_{k=1}^{n}b_k^p)^{\frac{1}{p}},其中 \small p\geqslant 1\small a_k\geqslant 0,b_k\geqslant 0,k=1,2,...,n

在实际应用中,常常需要利用已知的范数去构造出实用的向量范数:

设 \small A\in \mathbb{C}^{m\times n}_n\small ||\cdot||_a 是 \small \mathbb{C}^m 上的一种向量范数,对任意 \small x\in \mathbb{C}^n,则由 \small ||x||_b=||Ax||_a 定义的实值函数  \small ||\cdot||_b :\small \mathbb{C}^n\rightarrow \mathbb{R} 为中向量范数。

证明实值函数 \small ||\cdot||_b\small \mathbb{C}^n\rightarrow \mathbb{R} 满足非负性、齐次性和三角不等式

由于满足\small A\in \mathbb{C}^{m\times n}_n的矩阵有无穷多个,这样由一个已知的范数就可以构造出无穷多个新的向量范数。

【例2】设\small A\in \mathbb{C}^{m\times n}_n 是Hermite正定矩阵

对任意 \small x\in \mathbb{C}^n,规定 \small ||x||_A=\sqrt{x^HAx},则有上式定义的实值函数 \small ||\cdot||_A:\mathbb{C}^n\rightarrow \mathbb{R}

为 \small \mathbb{C}^n 中的向量范数(满足三条性质)

1.2,向量范数的性质

范数的基本性质:(1)向量范数的连续性;(2)不同向量范数之间的重要关系——等价关系。

设 \small x=(\xi_1,\xi_2,...,\xi_n)^T\in \mathbb{C}^n,则 \small ||x|| 是关于 \small x 的分量 \small \xi_1,\xi_2,...,\xi_n 的连续函数。

证明:对任意 \small y=(\eta_1,\eta_2,...,\eta_n )^T\in \mathbb{C}^n,则

\small |||x||-||y|||\leqslant ||x-y||\leqslant \sum_{k=1}^n|\xi_k-\eta_k|||e_k||

\small \leqslant \underset{k}{max}|\xi_k-\eta_k|\sum_{k=1}^n||e_k||=M \underset{k}{max}|\xi_k-\eta_k|

其中 \small M=||e_1||+||e_2||+...+||e_n||

设 \small ||\cdot||_a,||\cdot||_b 是 \small \mathbb{C}^n 上的两种向量范数,如果存在正数 \small m 和 \small M,使对任意 \small x\in \mathbb{C}^n 都有:\small m||x||_b\leqslant ||x||_a\leqslant M||x||_b,则称向量范数 \small ||\cdot||_a 与 \small ||\cdot||_b 等价。

引入范数等价概念的原因:需要讨论范数的某种性质时,若某种范数具有此性质,则与该范数等价的所有范数都具有此性质,后面将看到所有向量范数都是等价的。因此,经常只需讨论某一种范数的性质即可。

\small \mathbb{C}^n 上的所有向量范数都是等价的

证明:

(1)考虑空间\small \mathbb{C}^n上的单位球面 \small S=\left \{ x\in \mathbb{C}^n|\, ||x||_2=1 \right \},并证明 \small ||x||_a 与 \small ||x||_2 即可。(等价具有传递性)

(2)向量范数 \small ||x||_a 看成其分量的函数时是连续函数,而单位球面 \small S 为有限闭集,因此\small ||x||_a 在 \small S 上存在最小值 \small m 和最大值 \small M

(3)对任意 \small 0\ne x\in\mathbb{C}^n\small \frac{x}{||x||_2}\in S,从而有 \small m\leqslant ||\frac{x}{||x||_2}||_a\leqslant M 

常见三种范数的等价关系:

\small \frac{1}{\sqrt{n}}||x||_1\leqslant ||x||_2\leqslant ||x||_1

\small ||x||_\infty \leqslant||x||_1 \leqslant n||x||_\infty

\small ||x||_\infty \leqslant||x||_2 \leqslant \sqrt{n}||x||_\infty

给定 \small \mathbb{C}^n 中的向量序列 \small \left \{ x^{(k)} \right \},其中:

\small x^{(k)}=(\xi_1^{(k)},\xi_2^{(k)},...,\xi_n^{(k)})(k=0,1,2,...)

如果:\small \underset{k\rightarrow +\infty }{lim}\xi_j^{(k)}=\xi_j(j=1,2,...,n)

则称向量序列 \small \left \{ x^{(k)} \right \} 收敛于 \small x(\xi_1,\xi_2,...,\xi_n)^T,简称\small \left \{ x^{(k)} \right \} 收敛,记作:

\small \underset{k\rightarrow +\infty }{lim}x^{(k)}=x 或 \small x^{(k)}\rightarrow x(k\rightarrow +\infty )

不收敛的向量序列称为是发散的。

\small \mathbb{C}^n 中的向量序列 \small \left \{ x^{(k)}\right \} 收敛到 \small x 的充分必要条件是,对于 \small \mathbb{C}^n 中的任意一种向量范数 \small ||\cdot||,都有 \small \underset{k\rightarrow +\infty }{lim}||x^{(k)}-x||=0

证明:

(1)先选取一种特殊的向量范数(如最大范数)证明结论成立。

(2)再利用范数的等价性证明任意一种向量范数的结果与取最大范数的结果是一样的。

2,矩阵范数

2.1,方阵的范数

(1)向量是一种特殊矩阵,引入矩阵范数时要保持向量范数的特性不变。

(2)由于一个 \small m\times n 矩阵可以看作 \small mn 维的向量,因此可以按定义向量范数的方式定义矩阵范数,但是矩阵之间还有乘法运算,在研究矩阵范数时应予以考虑。

设 \small \mathbb{C}^{n \times n} 表示复数域 \small \mathbb{C} 上全体 \small n\times n 矩阵构成的线性空间,称函数 \small ||\cdot||:\mathbb{C}^{n\times n}\rightarrow \mathbb{R} 为矩阵范数,是指对所有 \small A,B\in \mathbb{C}^{n\times n} 有下列性质:

(1)非负性:\small ||A||\geqslant 0 并且 \small ||A||=0 当且仅当 \small A=0

(2)齐次性:对任何 \small \lambda \in \mathbb{C}\small ||\lambda A||=|\lambda|||A||

(3)三角不等式:\small ||A+B||\leqslant ||A||+||B||

(4)相容性:\small ||AB||\leqslant ||A||||B|| 

矩阵范数具有与向量范数相似的性质:(1)\small ||-A||=||A||,|||A||-||B|||\leqslant ||A-B|| (2)\small \mathbb{C}^{n \times n} 上的任意两个矩阵范数等价。

相容性的合理性:如果将矩阵范数定义中的相容性不等号反向,即 \small ||AB||>||A||||B||,则幂零矩阵的矩阵范数将是 0,与非负性不符。

矩阵范数汇总相容性的出现,使得向量范数的表达式推广到矩阵情形时,有时需要一定的修改。

设 \small A=(a_{ij})_{n\times n}\in \mathbb{C}^{n\times n},则下列实值函数都是 \small \mathbb{C}^{n\times n} 上的矩阵范数:

  • \small m_1 范数:\small ||A||_{m_1}=\sum_{i=1}^n\sum_{j=1}^n|a_{ij}|
  • \small Frobenius 范数:\small ||A||_F=\sqrt{\sum_{i=1}^n\sum_{j=1}^n|a_{ij}|^2}=\sqrt{tr(A^HA)}
  • \small m_{\infty } 范数:\small ||A||_{m_\infty }=n\, \underset{i,j}{max}|a_{ij}|

矩阵的\small m_1 范数和 \small F 范数是向量 1和 2 范数的自然推广,矩阵\small F 范数具有类似于向量范数的酉不变性。

对于矩阵的 \small F 范数,下列结论成立:

  • \small F 范数的矩阵迹表示:\small ||A||^2_F=tr(A^HA)=tr(AA^H)=||A^H||_F^2
  • \small F 范数的酉不变性:对任意的 \small n 阶酉矩阵 \small U,V,恒有\small ||UA||_F=||AV||_F=||UAV||_F=||A||_F

2.2,与向量范数的相容性

在实际运算中矩阵和向量常会同时出现,所以矩阵范数和向量范数也会同时出现,因此需要建立矩阵范数和向量范数的联系:

设 \small ||\cdot||_m 是 \small \mathbb{C}^{n\times n} 上的矩阵范数,\small ||\cdot||_v 是 \small \mathbb{C}^n 上的向量范数,如果对任意 \small A\in \mathbb{C}^{n\times n} 和 \small x\in \mathbb{C}^n 都有:\small ||Ax||_v\leqslant ||A||_m||x||_v,则称矩阵范数 \small ||\cdot||_m 与向量范数 \small ||\cdot||_v 是相容的。

【例3】证明 \small \mathbb{C}^{n \times n} 上的矩阵 \small m_1 范数与 \small \mathbb{C}^n上的向量1范数相容。

设 \small A=(a_{ij})_{n\times n},x=\left \{ \xi_1,\xi_2,...,\xi_n \right \}^T,则:

\small ||Ax||_1=\sum_{i=1}^n|\sum_{k=1}^na_{ik}\xi_k|\leqslant \sum_{i=1}^n(\sum_{k=1}^n|a_{ij}||\xi_k|)

\small \leqslant (\sum_{i=1}^n\sum_{k=1}^n|a_{ik}|)(\sum_{k=1}^n|\xi_k|)=||A||_{m_1}||x||_1

【例4】证明 \mathbb{C}^{n\times n} 上的矩阵 m_\infty 范数与\mathbb{C}^n上的向量 \infty 范数相容。

设 \small A=(a_{ij})_{n\times n},x=\left \{ \xi_1,\xi_2,...,\xi_n \right \}^T,则:

||Ax||_\infty =\underset{i}{max}|\sum_{k=1}^na_{ik}\xi_i|\leqslant \underset{i}{max}\sum_{k=1}{n}|a_{ik}||\xi_k|\leqslant n\, \underset{i,k}{max}|a_{ik}|\underset{k}{max}|\xi_k|

=||A||_{m_\infty }||x||_\infty

设 ||\cdot||_m 是 \mathbb{C}^{n\times n} 上的一种矩阵范数,则在 \mathbb{C}^n 上必存在与它相容的向量范数。

2.3,从属范数

已知 \mathbb{C}^n 上的向量范数 ||\cdot||_v,对任意 A\in \mathbb{C}^{n\times n},规定:

||A||=\underset{x\ne 0}{max}\frac{||Ax||_v}{||x||_v} 或  ||A||=\underset{||x||_v=1}{max}||Ax||_v

则 ||\cdot|| 是 \mathbb{C}^n 上与向量范数 ||\cdot||_v 相容的矩阵范数,且||I_n||=1

称之为由向量范数 ||\cdot||_v 导出的矩阵范数或从属于向量范数 ||\cdot||_v导出的矩阵范数,简称导出范数或从属范数。

非负性、齐次性和三角不等式直接利用向量范数的性质得到。

证明相容性:

\small ||A||=\underset{x\ne 0}{max}\frac{||Ax||_v}{||x||_v},易知 \small ||Ax||_v\leqslant ||A||\, ||x||_v

\small ||AB||=\underset{x\ne 0}{max}\frac{||(AB)x||_v}{||x||_v}\leqslant \underset{x\ne 0}{max}\frac{||A||||Bx||_v}{||x||_v}=||A||||B||

\small ||I||=\underset{x\ne0}{max}\frac{||Ix||_v}{||x||_v}=I

设 \small A=(a_{ij})_{n\times n}\in \mathbb{C}^{n\times n},记由向量 \small 1,2,\infty 范数导出的矩阵范数分别为 \small ||A||_1,||A||_2,||A||_\infty,则有:

(1)1范数(列和范数):\small ||A||_1=\underset{j}{max}\sum_{i=1}^n|a_{ij}|

(2)2范数(普范数):\small ||A||_2=\sqrt{\lambda_1}\small \lambda_1 为 \small A^HA 的最大特征值。

(3)\small \infty 范数(行和范数):\small ||A||_\infty=\underset{i}{max}\sum_{j=1}^n|a_{ij}|

设 \small A\in \mathbb{C}^{n \times n}\small U 和 \small V 为 \small n 阶酉矩阵,则:

(1)\small ||A^H||_2=||A||_2

(2)\small ||UA||_2=||AV||_2=||UAV||_2=||A||_2

(3)若 \small A 是正规矩阵,且 \small \lambda_1,\lambda_2,...,\lambda_n 是 \small A 的 \small n 个特征值,则:\small ||A||_2=\underset{k}{max}|\lambda_k|

2.4,长方阵的范数

把方阵的范数推广到 \small m\times n 矩阵的情形:

(1)在矩阵范数的定义中的相容性应该改成:对任意 \small A\in \mathbb{C}^{m\times n},B\in \mathbb{C}^{n\times l} 都有 \small ||AB||\leqslant ||A||||B||

(2)在与向量范数的相容性的定义中:对任意 \small A\in \mathbb{C}^{m\times n}\small x\in \mathbb{C}^n,都有 \small ||Ax||_v\leqslant ||A||_m||x||_v

(3)在从属范数的定义中:对任意 \small A\in \mathbb{C}^{m\times n},有:\small ||A||=\underset{x\ne }{max}\frac{||Ax||_v}{||x||_v}

对任意  \small A\in \mathbb{C}^{m\times n},常用的矩阵范数有:

(1)\small m_1 范数:\small ||A||_{m_1}=\sum_{i=1}^m\sum_{j=1}^n|a_{ij}|

(2)\small F 范数:\small ||A||_F=\sqrt{\sum_{i=1}^m\sum_{j=1}^n|a_{ij}|^2}=\sqrt{tr(A^HA)}

(3)\small M 范数:\small ||A||_M=max\left \{ m,n \right \}\underset{i,j}{max}|a_{ij}|

(4)\small G 范数:\small ||A||_G=\sqrt{mn}\, \underset{i,j}{max}|a_{ij}|

(5)\small ||A||_1=\underset{j}{max}\sum_{i=1}^m|a_{ij}|

(6)\small ||A||_\infty=\underset{i}{max}\sum_{j=1}^m|a_{ij}|

(7)\small ||A||_2=\sqrt{\lambda_1}\small \lambda_1 为 \small A^HA 的最大特征值。

当矩阵退化为向量时,\small F范数就退化为向量 \small 2 范数,  \small F范数可以看成向量 \small 2 范数的推广。 

(1)\small F范数和\small 2 范数具有酉不变性 

(2)\small m_1 范数与向量 \small 1 范数相容

(3)\small M 范数与向量 \small 1 范数、\small 2 范数、\small \infty 范数都相容

(4)矩阵的 \small 1 范数、\small 2 范数、\small \infty 范数分别由向量的 \small 1 范数、\small 2 范数、\small \infty 范数导出,从而与相应的向量范数相容。

3,范数应用举例

3.1,矩阵的谱半径

设 \small A\in \mathbb{C}^{n\times n}\small \lambda_1,\lambda_2,...,\lambda_n 为矩阵 \small A 的 \small n 个特征值,称 \small \rho(A)=\underset{j}{max}|\lambda_j| 为矩阵 \small A 的谱半径。(不是矩阵范数,不满足三角不等式)

设 \small A\in \mathbb{C}^{n\times n},则:

  • \small \rho(A^k)=(\rho(A))^k
  • \small \rho(A^HA)=\rho(AA^H)=||A||_2^2
  • 当 \small A 为正规矩阵时,\small \rho(A)=||A||_2

证明(1)

\small p(A^k)=\underset{i}{max}|\lambda_i^k|=(\underset{i}{max}|\lambda_i|)^k=(\rho(A))^k

证明(2)

\small A^HA 与 \small AA^H 有相同的非负特征值

设 \small A\in \mathbb{C}^{n \times n}

(1)则对 \small \mathbb{C}^{n\times n} 上的任意一个矩阵范数 \small ||\cdot||,都有:\small \rho(A)\leqslant ||A||

(2)则对任意给定的正数 \small \varepsilon,存在某一个矩阵范数 \small ||\cdot||_m,使得:\small ||A||_m\leqslant \rho(A)+\varepsilon

证明(2):由 \small Jordan 定理知,存在可逆矩阵 \small P\in \mathbb{C}^{n\times n}_n,使得

\small P^{-1}AP=J=\begin{bmatrix} \lambda_1 &\delta_1 & & \\ & \lambda_2 & ... & \\ & & ...&\delta_{n-1} \\ & & & \lambda_n \end{bmatrix}

令 \small D=diag(1,\varepsilon,...,\varepsilon^{n-1} )

\small D^{-1}P^{-1}APD=D^{-1}JD=\begin{bmatrix} \lambda_1 &\varepsilon \delta_1 & & \\ & \lambda_2 & ... & \\ & & ...&\varepsilon \delta_{n-1} \\ & & & \lambda_n \end{bmatrix}

于是 \small ||D^{-1}P^{-1}APD||_\infty \leqslant \underset{j}{max}(|\lambda_j|+\varepsilon )=\rho(A)+\varepsilon

对任意 \small B\in \mathbb{C}^{n\times n},规定 \small ||B||_m=||D^{-1}P^{-1}BPD||_\infty

容易验证 \small ||\cdot||_m 是 \small \mathbb{C}^{n\times n} 上的一个矩阵范数,且有:

\small ||A||_m=||D^{-1}P^{-1}APD||_\infty \leqslant \rho(A)+\varepsilon

【例5】已知 \small A=\begin{bmatrix} 0 & 0.2 & 0.1\\ -0.2 &0 &0.2 \\ -0.1& -0.2 &0 \end{bmatrix},试估计 \small A 的谱半径:

\small ||A||_{m_1}=\sum_{i=1}^{3}\sum_{j=1}^{3}|a_{ij}|=1

\small ||A||_{m_\infty }=3\times \underset{i,j}{max}|a_{ij}|=0.6

\small ||A||_F=\sqrt{\sum_{i=1}^3\sum_{j=1}^3|a_{ij}|^2}=\sqrt{0.18}\approx 0.42

\small ||A||_1=\underset{j}{max}\sum_{i=1}^3|a_{ij}|=0.4

\small ||A||_\infty =\underset{i}{max}\sum_{j=1}^3|a_{ij}|=0.4

3.2,矩阵的条件数

考虑如下的线性方程组:

\small \left\{\begin{matrix} 1.001x_1+0.999x_2=2\\ 0.999x_1+1.001x_2=2 \end{matrix}\right.

其解为 \small x=[x_1,x_2]^T=[1,1]^T,如果把方程组的有端项做微小扰动 \small \delta b=(10^{-3},10^{-3})^T,则线性方程组为:

\small \left\{\begin{matrix} 1.001x_1+0.999x_2=2.001\\ 0.999x_1+1.001x_2=1.999\end{matrix}\right.

方程组的解为:\small \tilde{x}=(\tilde{x_1},\tilde{x_2})^T=(1.5,0.5)^T,因此有:

\small \frac{||\tilde{x}-x||_\infty}{||x||_\infty }=0.5,\frac{||\delta b||_\infty}{||b||_\infty }=2000

这表明解的相对误差是右端相对误差的1000倍。

设 \small P\in \mathbb{C}^{n\times n},若对 \small \mathbb{C}^{n\times n} 上的某个矩阵范数 \small ||\cdot||,有 \small ||P||<1,则 \small I-P 可逆。

证明:设 \small \lambda 为 \small A 的任一特征值,则:

\small |\lambda |\leqslant \rho(A)\leqslant ||P||<1

因此,\small I-P 的任一特征值 \small 1-\lambda 都不为零,即 \small I-P 可逆。

设 \small A\in \mathbb{C}^{n\times n}_n\small \delta A\in \mathbb{C}^{n\times n},若对 \small \mathbb{C}^{n\times n} 上的某个矩阵范数 \small ||\cdot||,有 \small ||A^{-1}\delta A||<1,则:

  • \small A+\delta A 可逆
  • \small ||(A+\delta A)^{-1}||\leqslant \frac{||A^{-1}||}{1-||A^{-1}\delta A||}
  • \small \frac{||A^{-1}-(A+\delta A)^{-1}||}{||A^{-1}||}\leqslant \frac{||A^{-1}\delta A||}{1-||A^{-1}\delta A||}

 \small A\in \mathbb{C}^{n\times n}_n\small \delta A\in \mathbb{C}^{n\times n},若对 \small \mathbb{C}^{n\times n} 上的某个矩阵范数 \small ||\cdot||,有 \small ||A^{-1}||||\delta A||<` ,则:

\small \frac{||A^{-1}-(A+\delta A)^{-1}||}{||A^{-1}||}\leqslant \frac{||A||||A^{-1}||\frac{||\delta A||}{||A||}}{1-||A||||A^{-1}||\frac{||\delta A||}{||A||}}

\small A\in \mathbb{C}^{n\times n}_n\small \delta A\in \mathbb{C}^{n\times n}\small b,\delta b\in \mathbb{C}^n,若对 \small \mathbb{C}^{n\times n} 上的某一矩阵范数 \small ||\cdot||,有 \small ||A^{-1}||||\delta A||<1,则非齐次线性方程组 \small Ax=b 与 \small (A+\delta A)(x+\delta x)=b+\delta b 的解满足:

\small \frac{||\delta x||_v}{||x||_v}\leqslant \frac{||A||||A^{-1}||}{1-||A||||A^{-1}||\frac{||\delta A||}{||A||}}\left ( \frac{||\delta A||}{||A||}+\frac{||\delta b||_v}{||b||_v} \right )

其中 \small ||\cdot||_v 是 \small \mathbb{C}^n 上与矩阵范数 \small ||\cdot|| 相容的向量范数。

(1)数据的误差对可逆矩阵和线性方程组解的影响与数\small ||A||||A^{-1}|| 的大小相关。

(2)当该数据较大时,近似逆矩阵的相对误差或线性方程组的解的相对误差可能比较大。

(3)因此该数可以作为数据误差对于求逆矩阵和线性方程组的解影响大小的一种度量。

设 \small A\in \mathbb{C}^{n \times n}_n\small ||\cdot|| 是 \small \mathbb{C}^{n\times n} 上的矩阵范数,称:

\small cond(A)=||A||||A^{-1}|| 

为矩阵 \small A(关于求逆或求解线性方程组)的条件数。

一般地,如果矩阵 \small A 的条件数大就称求逆矩阵或求解线性方程组是病态的或坏条件的;否则,称为良态或好条件的。

\small cond_\infty (A)=||A||_\infty ||A^{-1}||_\infty

\small cond_2(A)=||A||_2||A^{-1}||_2=\sqrt{\frac{\mu _1}{\mu _n}}

其中 \small \mu_1,\mu_n 分别为 \small A^HA 的最大和最小特征值。

当 \small A 为正规矩阵时,有 \small cond_2(A)=\frac{|\lambda_1|}{|\lambda_n|},其中 \small \lambda_1,\lambda_n 分别为 \small A 的按模最大和最小特征值。

【例6】设 \small A=\begin{bmatrix} 1 &1 \\ 2 &1 \end{bmatrix},B=\begin{bmatrix} 3&1 \\ 1&3 \end{bmatrix},计算:\small cond_1(A),cond_2(A),cond_1(B),cond_2(B)

\small cond_1(A)=||A||_1||A^{-1}||_1=3\times 3=9

\small A^HA=\begin{bmatrix} 2 & 3\\ 3 & 5 \end{bmatrix}\small |\lambda I-A^HA|=\lambda^2-7\lambda +1

\small A^HA 的两个特征值分别为:\small \lambda_1=\frac{7+3\sqrt{5}}{2},\lambda_2=\frac{7-3\sqrt{5}}{2}

\small cond_2(A)=||A||_2||A^{-1}||_2=\sqrt{\frac{|\lambda|_{max}}{|\lambda|_{min}}}=\frac{7+3\sqrt{5}}{2}

由于 \small B=\begin{bmatrix} 3 &1 \\ 1 & 3 \end{bmatrix}\small B^{-1}=\frac{1}{8}\begin{bmatrix} 3 & -1\\ -1 &3 \end{bmatrix}

故:

\small cond_\infty (B)=||B||_\infty ||B^{-1}||_\infty =4\times \frac{4}{8}=2

\small cond_2 (B)=||B||_2||B^{-1}||_2 =4\times \frac{1}{2}=2

你可能感兴趣的:(数学,矩阵)