线性代数复习总结,仅供笔者复习使用,参考教材:
线性代数是数学的一个分支,它的研究对象是向量、线性空间、线性变换和有限维的线性方程组。它与计算机联系甚密,尤其是在 AI 领域,常常使用庞大的矩阵进行图计算、并行计算等,以达到较快的计算速度。
行列式的本质是一个函数,返回方阵的行列式值,写做 D = |A| = det(A) = det(aij) 。
该定理经常在计算行列式时使用:先使用性质 5 对某一行或某一列进行变换,直至该行或列只有一个非零元素。然后使用定理 1 实现 行列式降阶 ,多次降阶至二维即可计算出结果。
行列式在计算机领域的应用主要体现在帮助矩阵计算系数上。另外,行列式在向量运算、几何空间、代数方程上也有一些应用。比如,三维向量 a = (a1,a2,a3),b = (b1,b2,b3),则 a × b 可以表示为:
∣ i j k a 1 a 2 a 3 b 1 b 2 b 3 ∣ = ( a 2 ∗ b 3 − a 3 ∗ b 2 ) i → + ( a 3 ∗ b 1 − a 1 ∗ b 3 ) j → + ( a 1 ∗ b 2 − a 2 ∗ b 1 ) k → \begin{vmatrix} i & j & k\\ a1&a2&a3\\ b1&b2&b3 \end{vmatrix} = (a2*b3-a3*b2)\overrightarrow{i} + (a3*b1-a1*b3)\overrightarrow{j} + (a1*b2-a2*b1)\overrightarrow{k} ia1b1ja2b2ka3b3 =(a2∗b3−a3∗b2)i+(a3∗b1−a1∗b3)j+(a1∗b2−a2∗b1)k
二维平面中经过 P (x1, y1) 和 Q (x2, y2) 的直线方程为:
P Q : ∣ x 1 y 1 1 x 2 y 2 1 x y 1 ∣ = 0 PQ:\begin{vmatrix} x1 & y1 & 1\\ x2 & y2 &1\\ x & y & 1 \end{vmatrix} = 0 PQ: x1x2xy1y2y111 =0
矩阵的本质是一个 m 行 n 列的数表,数表的元不做特别说明时均为实数,即实矩阵。写做 A = Am×n = (aij)m×n = det(aij) 。
特殊矩阵:
当 m = n 时称为 n 阶方阵;
当 Am×n 中所有元均为 0 时称为零矩阵;
当 m = 1 时称为行矩阵;
当 n = 1 时称为列矩阵;
当两个矩阵大小相同(即行数和列数均相同)时称为同型矩阵;
当某方阵的主对角线元素不全为 0,其余元素均为 0 时称为对角矩阵,记为 diag( λ \lambda λ1, λ \lambda λ2, … , λ \lambda λn);
当某方阵的反对角线元素不全为 0,其余元素均为 0 时称为反对角矩阵;
当对角矩阵的主对角线上元素都相同时称为数量矩阵;
当数量矩阵的主对角线上元素均为 1 时称为单位矩阵,记为 E 或 I;
如果 AT = A,即 aij = aji,则称 A 为对称矩阵;每一个元都为实数的对称矩阵称为实对称矩阵;
如果 AT = -A,即 aij = -aji,则称 A 为反对称矩阵;每一个元都为实数的反对称矩阵称为实反对称矩阵;
当某方阵的行列式为 0 时称为奇异方阵,否则称为非奇异方阵;
当方阵 A 满足 AAT = E 或 ATA = E 时,则称 A 为正交矩阵。显然 | A | = ±1,A-1 = AT;
共轭矩阵:如果矩阵 A = (aij)m×n 中存在复数元,则 A 称为复矩阵。 a ‾ \overline{a} a 是 a 的共轭复数,则称 A ‾ \overline{A} A = ( a ‾ \overline{a} aij)m×n 为 A 的共轭矩阵;
矩阵乘法运算规则如下:
A (BC) = (AB) C
A (B + C) = AB + AC
k (AB) = (kA) B = A (kB)
A2 - E = (A + E)(A - E) = (A - E)(A + E)
A2 - B2 ≠ (A + B)(A - B)
(A + B)2 ≠ A2 + B2 + 2AB
(AB)k ≠ AkBk
AB = O 无法推出 A = O 或 B = O
矩阵转置运算规则如下:
(AT)T = A
(A + B)T = AT + BT
(kA)T = kAT
(AB)T = BTAT
若 AAT = O,则 A = O
方阵的行列式运算规则如下,设 A, B 均为 n 阶方阵:
| AT | = | A |
| kA | = kn| A |
| AB | = | A || B | = | BA |(此处如果 A 和 B 分别为 m×n 和 n×m 矩阵,那么 | AB | ≠ | BA |)
矩阵的秩定义为最高阶非零子式的阶数 r,还可以理解 r 为行(或列)方向上最大线性无关向量的个数,即 行(或列)向量组的最大线性无关组中向量的个数就是矩阵的秩。矩阵的行向量组的秩也称为行秩,列向量组的秩称为列秩。
矩阵的秩等于其行秩,也等于其列秩。以 A = ((1, 0, 1), (0, 1, 0), (0, 0, 0))为例,显然有 R(A) = 2。(1, 0, 1) 和 (0, 1, 0) 线性无关,所以行秩为 2;(1, 0)T 和 (0, 1)T 线性无关,所以列秩为 2。这里有一个误区,就是 A 已经化为行阶梯形,那么矩阵的秩就是非零行数,为 2,但是此时非零列数并不能代表列秩,因为已经做了初等行变换。
A 是满秩矩阵意味着方阵 A 的行、列向量组均线性无关。
行满秩和列满秩的关系不同于行秩和列秩:行满秩说明行数小于列数且行向量线性无关,如 A = ((1, 0, 1, 0), (0, 1, 0, 0), (0, 0, 0, 1));列满秩说明行数大于列数且列向量线性无关,如 B = ((0, 0, 1), (0, 1, 0), (1, 0, 0), (0, 0, 1))。而行秩和列秩是用来表示矩阵能够形成的空间维数。
设矩阵 Am×n 的行秩为 s,列秩为 t(s<=m, t<=n),则矩阵 AT 的行秩为 t,列秩为 s,所以 R(A) = R(AT) = min{s, t}。
证明 R(ATA) = R(A) 则需要通过证明方程 AX = O 和 ATAX = O 同解实现:AX = O 显然可以推出 ATAX = O;ATAX = O 可以推出 XTATAX = O,即 (AX)TAX = O,从而推出 AX = O。因此 R(A) = R(ATA)。
(2)若矩阵 Am×n,则 R(A) <= min{m, n};
(3)若 A 和 B 为同型矩阵,则 R(A ± B) <= R(A | B) <= R(A) + R(B);
将 A 和 B 拆成列向量组,则 A ± B 可以用 (A | B) 的最大线性无关组进行线性表示,因此 R(A ± B) <= R(A | B)。R(A | B) <= R(A) + R(B) 显然。
(4)max{R(A), R(B)} <= R(A | B) <= R(A) + R(B);
(5)R(AB) <= min{R(A), R(B)};
根据矩阵的线性表示,矩阵 AB 的行向量组可以视为 B 的行向量组的线性组合,所以 R(AB) <= R(B)。又矩阵 AB 的列向量组可以视为 A 的列向量组的线性组合,所以 R(AB) <= R(A)。
(6)若矩阵 Am×n,Bn×s,AB = O,则 R(A) + R(B) <= n;
AB = O 可以看作 A( β 1 , β 2 , . . . , β s \beta_1, \beta_2, ..., \beta_s β1,β2,...,βs) = (0, 0, …, 0),即 B 的列向量都是矩阵方程 Ax = 0 的解,显然最多有 n - R(A) 个线性无关的解(n 为未知数的个数,即 x 的行数),因此 R(B) <= n - R(A),即 R(A) + R(B) <= n。
(7)若方阵 An×n 的秩为 n,则 R(A*) = n;若方阵 An×n 的秩为 n-1,则 R(A*) = 1;若方阵 An×n 的秩小于 n-1,则 R(A*) = 0;
R(A) = n 时,| A | ≠ 0,则 | A* | = | A |n-1 ≠ 0,所以 R(A*) = n;
R(A) = n-1 时,A 存在非零的代数余子式,因此 R(A*) >= 1;又 AA* = | A |E = O,因此 R(A) + R(A*) <= n,所以 R(A*) <= 1;所以 R(A*) = 1;
R(A) <= n-2 时,A 的所有代数余子式均为零,所以 则 R(A*) = 0。
(8)同型矩阵等价的充要条件是秩相等;
若矩阵 A 经过有限次初等行变换变成矩阵 B,则 A 的行向量组与 B 的行向量组等价,A 的任意 k 个列向量与 B 中对应位置的 k 个列向量具有相同的线性相关性;若矩阵 A 经过有限次初等列变换变成矩阵 B,则 A 的列向量组与 B 的列向量组等价,A 的任意 k 个行向量与 B 中对应位置的 k 个行向量具有相同的线性相关性。
任何一个矩阵都可以经过有限次初等行变换化成行阶梯形及行最简形,且矩阵的秩等于行阶梯形非零行的行数。
任何一个矩阵都可以经过有限次初等行变换化成标准型,因此任意矩阵都与自己的标准形等价。
初等方阵的性质:
由于初等变换都是可逆的,因此初等方阵也是可逆的;
满秩矩阵(不一定是方阵)可以表示为有限个初等方阵的乘积;
可逆矩阵(一定是方阵)可以表示为有限个初等方阵的乘积;
初等变换法可以用来求 A-1:如果矩阵 An 可逆,则 (An | En) 可以经过有限次初等行变换得到 (En | An-1);
逆矩阵运算规则如下:
(A-1)-1 = A
(kA)-1 = 1 k \frac{1}{k} k1 A-1 (k ≠ 0)
(AB)-1 = B-1A-1
(AT)-1 = (A-1)T
伴随矩阵运算规则如下:
A* = | A |A-1
AA* = A*A = | A |E = (| A | δ \delta δij )
| A* | = | A |n-1
(A*)-1 = (A-1)* = 1 ∣ A ∣ \frac{1}{| A |} ∣A∣1 A
(A*)T = (AT)*
(kA)* = kn-1A*
(A*)* = | A |n-2A
(AB)* = B*A*
矩阵的逆的求解方法:
伴随矩阵法:A-1 = 1 ∣ A ∣ \frac{1}{| A |} ∣A∣1 A*,适用于阶数较低的可逆矩阵;
初等变换法:如果矩阵 An 可逆,则 (An | En) 可以经过有限次初等行变换得到 (En | An-1)
分块对角法:分块对角矩阵的逆等于对角线上每个子块取逆,显然 | A | = | A1 || A2 |…| As | ≠ 0 才可逆,即对角线上每个子块都可逆;
矩阵方程 AX = B就是 n 元一次方程,n 元一次方程想要有唯一解就需要有 n 组方程,且这 n 组方程之间相互加减运算也不会重复(即全是有效方程,没有等价方程)。这就相当于系数矩阵 A 是满秩矩阵,即 | A | ≠ 0。
一组同维的向量可以构成一个向量组,线性相关 / 无关性是向量组的重要特征。向量空间是由向量组成的满足运算封闭性的集合,线性空间则是广义向量构成的满足运算封闭性的集合。
由于空间的同构性,因此只需要弄清楚 n 维向量空间的概念与性质,就可以类比到与之同构的 n 维线性空间,向量空间的子空间、基、坐标等概念都可以类比到线性空间,线性空间中抽象的广义向量也可以用具体的数组向量表示,抽象的线性变换也可以用矩阵表示。
线性相关性其实就是向量组中的某向量可以被其他向量线性表示,可以形象的理解为这组向量中有重复。比如某向量组只含有 α \alpha α 和 β \beta β,如果其线性相关,要么有 0 向量,要么 α \alpha α 和 β \beta β 对应分量成比例。向量组中只要有一个 0 向量,则该组向量线性相关。
还可以将 α i \alpha _i αi 都视为列向量,则 ( α 1 \alpha _1 α1, α 2 \alpha _2 α2,…, α m \alpha _m αm) 是一个 n×m 的系数矩阵 A。 λ 1 α 1 + λ 2 α 2 + . . . + λ m α m \lambda _1\alpha _1 + \lambda _2 \alpha _2 + ... + \lambda _m \alpha _m λ1α1+λ2α2+...+λmαm = 0 就是一个 m 元一次齐次方程组,向量组线性无关则表示没有非零解。
定理:
(1)向量组 α 1 \alpha _1 α1, α 2 \alpha _2 α2,…, α m \alpha _m αm(m>=2)线性相关的充要条件时至少存在一个向量可以用其余 m-1 个向量线性表示;
(2)若向量组 α 1 \alpha _1 α1, α 2 \alpha _2 α2,…, α m \alpha _m αm 线性无关,向量组 α 1 \alpha _1 α1, α 2 \alpha _2 α2,…, α m \alpha _m αm, β \beta β 线性相关,则向量 β \beta β 可以由向量组 α 1 \alpha _1 α1, α 2 \alpha _2 α2,…, α m \alpha _m αm 线性表示,且表示式唯一;
(3)若向量组 α 1 \alpha _1 α1, α 2 \alpha _2 α2,…, α m \alpha _m αm 线性相关,则向量组 α 1 \alpha _1 α1, α 2 \alpha _2 α2,…, α m \alpha _m αm,…, α n \alpha _n αn(n > m)也线性相关;若向量组 β 1 \beta _1 β1, β 2 \beta _2 β2,…, β m \beta _m βm 线性无关,则向量组 β 1 \beta _1 β1, β 2 \beta _2 β2,…, β s \beta _s βs(s < m)也线性无关;
(4)设向量组 T1: α 1 \alpha _1 α1, α 2 \alpha _2 α2,…, α n \alpha _n αn ,T2: β 1 \beta _1 β1, β 2 \beta _2 β2,…, β n \beta _n βn 和 T3: γ 1 \gamma _1 γ1, γ 2 \gamma _2 γ2,…, γ n \gamma _n γn,其中 α i \alpha _i αi = (a1j, a2j, … , amj), β i \beta _i βi = (a1j, a2j, … , amj, am+1j), γ i \gamma _i γi = (γ1j, γ2j, … , γm-1j)(j = 1, 2, …, n)。若向量组 T1 线性无关,则 T2 也线性无关;若向量组 T1 线性相关,则 T3 也线性相关;
T1 线性无关显然能够推出 T2 线性无关,因为 T2 中每个向量都是在 T1 中对应向量的基础上进行增阶。 β i \beta _i βi 再添加有限个元素命题仍然成立。T1 线性相关推出 T3 线性相关同理。
(5)任意 n+1 个 n 维向量一定线性相关;
n+1 个向量想要线性无关则必须能够构成 n+1 维空间,显然 n 维向量无法做到。该命题可以扩展为 m > n 时,任意 m 个 n 维向量构成的向量组一定线性相关。
向量组 A 能由向量组 B 线性表示 的意思其实就是 A 中每个向量都在 B 的向量所组成的空间中。若 A 能由 B 线性表示且 A 线性无关,则 A 的向量个数小于等于 B 的向量个数。
等价的线性无关的向量组所含向量的个数相等,构成的向量空间相同,因此可以互相线性表示。
向量组的最大线性无关组就相当于基底,较为典型的有 n 维空间下的 n 个方向的单位向量。但向量组的最大线性无关组不一定唯一。
由于初等行变换不改变列向量的线性相关性,因此可以通过初等行变换将列向量组变换成阶梯型,从而得到列向量组的秩和最大线性无关组。
同理,初等列变换不改变行向量的线性相关性,因此可以通过初等列变换将行向量组变换成阶梯型的转置,从而得到行向量组的秩和最大线性无关组。
最大线性无关组的性质:
(1)向量组 α 1 \alpha _1 α1, α 2 \alpha _2 α2,…, α n \alpha _n αn 线性无关的充要条件是 α 1 \alpha _1 α1, α 2 \alpha _2 α2,…, α n \alpha _n αn 的最大无关组是其本身;
(2)向量组的不同的最大线性无关组等价;
(3)向量组线性无关的充要条件是所含向量的个数等于向量组的秩;
若行秩等于所含向量的个数,则由该矩阵划分得到的行向量组线性无关;若列秩等于所含向量的个数,则由该矩阵划分得到的列向量组线性无关。因为一个矩阵的秩是确定的,所以划分得到的行 / 列向量组的最大无关组的个数相同,所以一个矩阵的行秩和列秩一定相同。
(4)设向量组 A 的秩为 r1,向量组 B 的秩为 r2,若 A 能由 B 线性表示,则 r1 <= r2;
A 能由 B 线性表示说明 A 中向量都在 B 的最大线性无关组所构成的向量空间上,因此 A 的维度不会高于 B,因此 r1 <= r2。
(5)等价的向量组有相同的秩;
正交向量组是一种特殊的线性无关向量组,线性无关向量组只是要求 n 个向量能够形成 n 维空间,而正交向量组还需要向量之间两两正交,也就是向量之间两两垂直。
标准正交向量组就是 n 维空间的 n 个单位坐标向量。
n 个 n 维行(或列)向量组成的标准正交向量组就是正交矩阵,这是判断 n 阶方阵是正交矩阵的充要条件。
向量空间由向量和运算组成,其实就是 n 维向量所组成的 n 维空间,如 n 维实空间 Rn = { (a1, a2, …, an)T | ai ∈ R, i = 1, 2, …, n },就满足加法和数乘的封闭性。X = { (x1, x2, …, xm)T | xi ∈ R, i = 1, 2, …, m 且 x1 + x2 + … + xm = 1 },不满足加法和数乘的封闭性,因此不是向量空间。
很显然,数域中一定包含 0 和 1,因为 K 中的数可以与自身作差或商。复数集 C、实数集 R、有理数集 Q 都是数域;整数集 Z 不是数域,因为不满足除法的封闭性。
前一节介绍的向量空间 V 中的元素都是向量,其实向量空间(也就是线性空间)中的元素并不一定要是向量,也可以是函数或者矩阵等。由于线性空间中元素加法的封闭性约束,线性空间中的元素一般都是同一类型。不过在线性空间中,一般统一将其元素都称为向量,即广义上的向量就是线性空间中的元素(狭义上的向量就是常见的形式,即有序数组)。比如全体 n 维向量(狭义上)组成的集合构成 n 维向量空间 Rn;全体 m×n 矩阵组成的集合构成矩阵空间 Mmn;次数不超过 n 的所有一元多项式组成的集合构成线性空间 P[x]n = { anxn + an-1xn-1 + … + a1x + a0 | an, an-1, …, a0 ∈ R }。
线性空间的本质就是定义了封闭的线性运算的非空集合。K 为复数集 C 时,称 V 为复线性空间;K 为实数集 R 时,称 V 为实线性空间。
这里的向量是广义上的向量,可以是向量,矩阵或者函数都可以。如线性空间 P[x]2 中的向量组 1, x, 2x2 线性无关,1, x, 2x+1, x2 线性相关。
代数中经常使用的函数就是一种特殊的映射:函数是所作用数域上的一个元素到另一个元素的映射,映射则是所作用的两个集合元素之间的映射。
线性变换其实就是线性空间 V 到自身的一种特殊映射,以下列举一些常见的线性变换:
- 恒等变换 I:V -> V,对任意 α \alpha α ∈ V,有 I( α \alpha α) = α \alpha α;
- 零变换 O:V -> V,对任意 α \alpha α ∈ V,有 O( α \alpha α) = 0;
- 数乘变换 T:V -> V,对任意 α \alpha α ∈ V,有 T( α \alpha α) = k α \alpha α;
线性变换的本质就是广义向量的映射,记为 y = C x y=Cx y=Cx。当 C 为可逆矩阵时,称为可逆线性变换;当 C 为正交矩阵时,称为正交变换。
同构的意思是具有相同的代数结构,因此只需要弄清楚 n 维向量空间的概念与性质,就可以类比到与之同构的 n 维线性空间。因此向量空间的子空间、基、坐标等概念都可以类比到线性空间,线性空间中抽象的广义向量也可以用具体的数组向量表示,抽象的线性变换也可以用矩阵表示。
比如在次数不超过 3 的所有一元多项式构成线性空间 P[x]3 中,取基 α 1 \alpha_1 α1 = 1, α 2 \alpha_2 α2 = x, α 3 \alpha_3 α3 = x2, α 4 \alpha_4 α4 = x3。对于任意 α \alpha α = a3x3 + a2x2 + a1x + a0 ∈ P[x]3,定义一个线性变换 D( α \alpha α) = 3a3x2 + 2a2x + a1。则对于 α 1 \alpha_1 α1,令 a3x3 + a2x2 + a1x + a0 = α 1 \alpha_1 α1 = 1,解得 a3 = a2 = a1 = 0,a0 = 1,因此 D( α 1 \alpha_1 α1) = 3a3x2 + 2a2x + a1 = 0;同理,D( α 2 \alpha_2 α2) = 1,D( α 3 \alpha_3 α3) = 2x,D( α 4 \alpha_4 α4) = 3x2。于是该变换可以写成:
D ( α 1 , α 2 , α 3 , α 4 ) = ( α 1 , α 2 , α 3 , α 4 ) ( 0 1 0 0 0 0 2 0 0 0 0 3 0 0 0 0 ) D(\alpha_1, \alpha_2, \alpha_3, \alpha_4) = (\alpha_1, \alpha_2, \alpha_3, \alpha_4) \left( \begin{matrix} 0 & 1 & 0 & 0 \\ 0 & 0 & 2 & 0 \\ 0 & 0 & 0 & 3 \\ 0 & 0 & 0 & 0 \\ \end{matrix} \right) D(α1,α2,α3,α4)=(α1,α2,α3,α4) 0000100002000030
当然,线性变换的矩阵表示与基的选择有关,同一线性变换在不同基下的矩阵表示一般也不同。
线性方程组的求解在工科中有相当广泛的应用,加减消元法是我们最早接触到的解决办法。当引入线性代数后,我们可以使用行列式、矩阵的秩、向量组进行讨论与求解。
A x = 0 Ax = 0 Ax=0 称为齐次线性方程组是因为方程的每一项都是 1 次项,即 x;而 A x − β = 0 Ax - \beta = 0 Ax−β=0 称为非齐次线性方程组是因为方程的有 0 次项。为了表示方便,将 β \beta β 扩展到系数矩阵 A 的下一列,称为增广矩阵,记为 A ‾ \overline{A} A = (A | β \beta β),即:
不像齐次线性方程组一定有零解,非齐次线性方程组想要有解,必须使得 A x = β Ax = \beta Ax=β 等式成立。又 A x = β Ax = \beta Ax=β 可以写成 ( α 1 , α 2 , . . . , α n \alpha_1, \alpha_2, ..., \alpha_n α1,α2,...,αn)(x1, x2, …, xn)T = β \beta β,即 x 1 α 1 + x 2 α 2 + . . . + x n α n = β x_1\alpha_1+x_2\alpha_2+...+x_n\alpha_n=\beta x1α1+x2α2+...+xnαn=β。所以想要非齐次线性方程组有解,必须有 β \beta β 可由 α 1 , α 2 , . . . , α n \alpha_1, \alpha_2, ..., \alpha_n α1,α2,...,αn 线性表示,即 ( α 1 , α 2 , . . . , α n \alpha_1, \alpha_2, ..., \alpha_n α1,α2,...,αn) 和 ( α 1 , α 2 , . . . , α n , β \alpha_1, \alpha_2, ..., \alpha_n, \beta α1,α2,...,αn,β) 等价,因此 R( A A A) = R( A ‾ \overline{A} A)。
有解的非齐次线性方程组称为相容的,否则称为不相容。
本章讨论的矩阵都是方阵,因为只有方阵才有特征值与特征向量,只有方阵才可能相似对角化。方阵在实际应用中有广泛的应用场景,很多归结到底都是求其特征值与特征向量。
要求 A 的特征值与特征向量,只要求满足方程 (A- λ \lambda λE) x x x = 0 的 λ \lambda λ 和 x x x。该方程有非零解的充要条件是系数矩阵的秩小于 n,即 | A- λ \lambda λE | = 0 0 0,通过该行列式可以求出 λ \lambda λ 的值。然后将 λ \lambda λ 代入原方程,求得该齐次线性方程组的无穷多组解。因此,对于 A 的特征值与特征向量,每个特征值对应无穷多个特征向量,但每个特征向量对应唯一的特征值。
n 个互不相同的特征值对应 n 个线性无关的特征向量,但 n 个线性无关的特征向量并不一定会有 n 个互不相同的特征向量。因为特征向量是由线性无关的基础解系构成,一个特征值对应的特征向量的基础解系就可能包含多个线性无关的特征向量。因此特征方程重根时(n 个特征值之间有重)也有可能会有 n 个线性无关的特征向量。
在复数范围内,n 阶方阵 A 有 n 个特征值。实矩阵的特征值不一定是实数,特征向量也不一定是实向量。但实对称矩阵的特征值一定是实数。
特征值的性质:
(1)设 λ 1 , λ 2 , . . . , λ n \lambda_1, \lambda_2, ..., \lambda_n λ1,λ2,...,λn 为方阵 A 的 n 个特征值,则有 λ 1 λ 2 . . . λ n \lambda_1\lambda_2...\lambda_n λ1λ2...λn = | A |;并且 λ 1 + λ 2 + . . . + λ n \lambda_1+\lambda_2+...+\lambda_n λ1+λ2+...+λn = ∑ i = 1 n a i i \sum_{i=1}^n a_{ii} ∑i=1naii,称为方阵 A 的迹,记为 tr(A);
(2)方阵 A 可逆的充要条件是是 A 的特征值全不为 0;
(3)若 λ \lambda λ 是方阵 A 的特征值,对应特征向量 p p p,则
矩阵 | A | A-1(A 可逆) | A* | kA | Ak | f f f(A) | AT | P-1AP |
---|---|---|---|---|---|---|---|---|
特征值 | λ \lambda λ | 1 λ \frac{1}{\lambda} λ1( λ \lambda λ ≠ 0) | ∣ A ∣ λ \frac{| A |}{\lambda} λ∣A∣( λ \lambda λ ≠ 0) | k λ \lambda λ | λ \lambda λk | f ( λ ) f(\lambda) f(λ) | λ \lambda λ | λ \lambda λ |
特征向量 | p p p | p p p | p p p | p p p | p p p | p p p | — | P-1 p p p |
(4)设 λ 1 , λ 2 , . . . , λ m \lambda_1, \lambda_2, ..., \lambda_m λ1,λ2,...,λm 是方阵 A 的 m 个特征值, p 1 , p 2 , . . . , p m p_1, p_2, ..., p_m p1,p2,...,pm 是依次与之对应的特征向量。如果 λ 1 , λ 2 , . . . , λ m \lambda_1, \lambda_2, ..., \lambda_m λ1,λ2,...,λm 各不相等,则 p 1 , p 2 , . . . , p m p_1, p_2, ..., p_m p1,p2,...,pm 线性无关;
(5)设 p i 1 , p i 2 , . . . , p i t i p_{i1}, p_{i2}, ..., p_{it_i} pi1,pi2,...,piti 是方阵 A 对应特征值 λ i \lambda_i λi 的 ti 个线性无关的向量(i = 1,2,…,m),且 λ 1 , λ 2 , . . . , λ m \lambda_1, \lambda_2, ..., \lambda_m λ1,λ2,...,λm 两两不相等。则 p 11 , p 12 , . . . , p 1 t 1 , p 21 , p 22 , . . . , p 2 t 2 , . . . , p m 1 , p m 2 , . . . , p m t m p_{11}, p_{12}, ..., p_{1t_1}, p_{21}, p_{22}, ..., p_{2t_2}, ..., p_{m1}, p_{m2}, ..., p_{mt_m} p11,p12,...,p1t1,p21,p22,...,p2t2,...,pm1,pm2,...,pmtm 线性无关;
相似关系是等价关系,具有自反性、对称性、传递性的性质。
相似矩阵的性质:
(1)若 n 阶方阵 A 与 B 相似,则 A 与 B 的特征多项式相同,特征值也相同;
该命题可以通过特征多项式证明:| B - λ \lambda λE | = | P-1AP - λ \lambda λE | = | P-1AP - P-1( λ \lambda λE)P | = | P-1 || A - λ \lambda λE || P | = | A - λ \lambda λE |。
但该命题的逆命题不成立,特征多项式和特征值相同无法推出相似,反例如下,求出来的 P 不可逆:
A = ( 1 1 0 1 ) , B = ( 1 0 0 1 ) A=\left(\begin{matrix} 1 & 1 \\ 0 & 1 \\ \end{matrix} \right),B=\left(\begin{matrix} 1 & 0 \\ 0 & 1 \\ \end{matrix} \right) A=(1011),B=(1001)
(2)若 n 阶方阵 A 与 B 相似,则 | A | = | B |,tr(A) = tr(B),R(A) = R(B);
(3)若 P-1AP = B,则 A ~ B、A-1 ~ B-1(A, B 可逆时)、Ak ~ Bk(k 为正整数)、 f f f(A) ~ f f f(B)( f f f 为多项式运算),且相似变换矩阵仍是 P;
(4)若 P-1AP = B,则 AT ~ BT,但相似变换矩阵不再是 P;
相似对角化:若 n 阶方阵 A 与对角矩阵 Λ \Lambda Λ = diag( λ \lambda λ1, λ \lambda λ2, … , λ \lambda λn) 相似,则称 A 是可以相似对角化的。 λ \lambda λ1, λ \lambda λ2, … , λ \lambda λn 也是 A 的 n 个特征值;
相似对角化的条件:
以上四个判据都可以推出 A 能够相似对角化,但前两个是等价条件,后两个只是充分条件。A 的特征值有重根时也有可能 A 可以相似对角化。
由于 n 阶方阵能否相似对角化较为复杂,因此仅讨论 A 为实对称矩阵的情形。因为实对称矩阵的 k 重根特征值对应的特征向量的基础解系包含 k 个线性无关的基向量,所以实对称矩阵一定有 n 个线性无关的特征向量,因此实对称矩阵一定可以相似对角化。
实对称矩阵的性质:
(1)实对称矩阵的特征值全都是实数;
(2)设 λ \lambda λ1, λ \lambda λ2 是实对称矩阵 A 的两个特征值, p 1 p_1 p1, p 2 p_2 p2 是对应的特征向量。若 λ \lambda λ1 ≠ λ \lambda λ2,则 p 1 p_1 p1 与 p 2 p_2 p2 正交;
(3)设 A 为 n 阶实对称矩阵, λ \lambda λ 是 A 的特征方程的 k 重根,则方阵 A - λ \lambda λE 的秩为 n - k,即 λ \lambda λ 对应 k 个线性无关的特征向量;
(4)设 A 为 n 阶实对称矩阵,则必有正交矩阵 P 使 P-1AP = Λ \Lambda Λ,其中 Λ \Lambda Λ 是以 A 的 n 个特征值为对角元的对角矩阵,称 A 正交相似于对角矩阵 Λ \Lambda Λ;
在解析几何中,二元函数 y = f(x) 是自变量 x 到因变量 y 的映射。对于解析几何中的 二次函数 或 二次方程,改变其一次项的系数并不会影响其形状,只是平移或伸缩。因此二次型只研究二次项,即将函数中的自变量 x 扩展为一个向量,并且函数中只包含二次项。这样的映射就是一个二次型,表示向量到实数的映射。
本节讨论的都是实二次型,只要令 a i j = a j i a_{ij}=a_{ji} aij=aji,则二次型可以用矩阵表示:
f ( x 1 , x 2 , . . . , x n ) = ( x 1 , x 2 , . . . , x n ) ( a 11 a 12 ⋯ a 1 n a 21 a 22 ⋯ a 2 n ⋮ ⋮ ⋱ ⋮ a n 1 a n 2 ⋯ a n n ) ( x 1 x 2 ⋮ x n ) f(x_1, x_2, ..., x_n)=(x_1, x_2, ..., x_n) \left( \begin{matrix} a_{11}& a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ a_{n1} & a_{n2} & \cdots & a_{nn} \\ \end{matrix} \right)\left( \begin{matrix} x_1\\ x_2 \\ \vdots \\ x_n \\ \end{matrix} \right) f(x1,x2,...,xn)=(x1,x2,...,xn) a11a21⋮an1a12a22⋮an2⋯⋯⋱⋯a1na2n⋮ann x1x2⋮xn
可以看出,二次型就相当于向量的二次函数,记为 f ( x ) = x T A x f(x)=x^TAx f(x)=xTAx,其中 A 为对称矩阵。若二次型 f f f 为实二次型,则 A 为实对称矩阵。
要想将二次型化为标准型,需要寻求可逆线性变换 x = C y x=Cy x=Cy,使得变换后的二次型只含有平方项。因为 f = x T A x = ( C x ) T A ( C y ) = y T ( C T A C ) y f=x^TAx=(Cx)^TA(Cy)=y^T(C^TAC)y f=xTAx=(Cx)TA(Cy)=yT(CTAC)y,所以只需要让 C T A C = Λ C^TAC= \Lambda CTAC=Λ,该关系称为合同。
合同关系是等价关系,具有自反性、对称性、传递性的性质。
由实对称矩阵的性质,必有正交矩阵 P 使 P-1AP = Λ \Lambda Λ,又由于正交矩阵满足 P-1 = PT,因此 PTAP = Λ \Lambda Λ,即总存在对角矩阵合同于实对称矩阵。想要将二次型化为标准型,实际上就是寻找可逆方阵 C,使得 A 与 Λ \Lambda Λ 合同,主要有特征值法、拉格朗日配方法和初等变换法。
若对于任意一组不全为 0 的实数 k 1 , k 2 , . . . , k n k_1, k_2, ..., k_n k1,k2,...,kn,都有 f ( k 1 , k 2 , . . . , k n ) f(k_1, k_2, ..., k_n) f(k1,k2,...,kn) < 0,则称实二次型 f ( x 1 , x 2 , . . . , x n ) f(x_1, x_2, ..., x_n) f(x1,x2,...,xn) 为负定二次型, f f f 的矩阵为负定矩阵;若对于任意一组不全为 0 的实数 k 1 , k 2 , . . . , k n k_1, k_2, ..., k_n k1,k2,...,kn,都有 f ( k 1 , k 2 , . . . , k n ) f(k_1, k_2, ..., k_n) f(k1,k2,...,kn) >= 0,则称实二次型 f ( x 1 , x 2 , . . . , x n ) f(x_1, x_2, ..., x_n) f(x1,x2,...,xn) 为半正定二次型, f f f 的矩阵为半正定矩阵;若对于任意一组不全为 0 的实数 k 1 , k 2 , . . . , k n k_1, k_2, ..., k_n k1,k2,...,kn,都有 f ( k 1 , k 2 , . . . , k n ) f(k_1, k_2, ..., k_n) f(k1,k2,...,kn) <= 0,则称实二次型 f ( x 1 , x 2 , . . . , x n ) f(x_1, x_2, ..., x_n) f(x1,x2,...,xn) 为半负定二次型, f f f 的矩阵为半负定矩阵;若二次型 f f f 既能取到正值,又能取到负值,则称实二次型 f ( x 1 , x 2 , . . . , x n ) f(x_1, x_2, ..., x_n) f(x1,x2,...,xn) 为不定二次型, f f f 的矩阵为不定矩阵。
矩阵的关系
等价关系:矩阵 A 经过有限次初等变换能够变成矩阵 B,记为 A ≅ \cong ≅ B;
相似关系:对方阵 A,B,存在可逆方阵 P,使 P-1AP = B 成立,记为 A ∼ \sim ∼ B;
合同关系:对方阵 A,B,存在可逆方阵 C,使 CTAC = B 成立,记为 A ≃ \simeq ≃ B;
对于实对称矩阵 A 和 B,相似必合同,合同必等价。