对于线性变换、基变换和坐标变换的理解

线性变换是一种特殊的线性映射,是线性空间到自身的映射。设n维线性空间 M M M上的线性变换 T T T,对任意向量 v ⃗ ∈ M \vec{v}\in M v M,取一组线性无关的基 v ⃗ 1 , v ⃗ 2 … … v ⃗ n ∈ M {\vec{v}}_1,{\vec{v}}_2\ldots\ldots{\vec{v}}_n\in M v 1,v 2v nM,有

v ⃗ = x 1 v ⃗ 1 + x 2 v ⃗ 2 + … + x n v ⃗ n \vec{v}=x_1{\vec{v}}_1+x_2{\vec{v}}_2+\ldots+x_n{\vec{v}}_n v =x1v 1+x2v 2++xnv n

v ⃗ \vec{v} v 在基 v ⃗ 1 , v ⃗ 2 … … v ⃗ n ∈ M {\vec{v}}_1,{\vec{v}}_2\ldots\ldots{\vec{v}}_n\in M v 1,v 2v nM中的坐标为 ( x 1 , x 2 … x n ) (x_1,x_2\ldots x_n) (x1,x2xn),记为 v ⃗ = V x ⋯ ⋯ ( 1 ) \vec{v}=Vx\cdots\cdots(1) v =Vx(1)
取一组线性无关的基 w ⃗ 1 , w ⃗ 2 … … w ⃗ n ∈ M {\vec{w}}_1,{\vec{w}}_2\ldots\ldots{\vec{w}}_n\in M w 1,w 2w nM
v ⃗ = y 1 w ⃗ 1 + y 2 w ⃗ 2 + … + y n w ⃗ n \vec{v}=y_1{\vec{w}}_1+y_2{\vec{w}}_2+\ldots+y_n{\vec{w}}_n v =y1w 1+y2w 2++ynw n

v ⃗ \vec{v} v 在基 w ⃗ 1 {\vec{w}}_1 w 1, w ⃗ 2 … … w ⃗ n ∈ M {\vec{w}}_2\ldots\ldots{\vec{w}}_n\in M w 2w nM中的坐标为 ( y 1 , y 2 … y n ) (y_1,y_2\ldots y_n) (y1,y2yn),记为 v ⃗ = W y ⋯ ⋯ ( 2 ) \vec{v}=Wy\cdots\cdots(2) v =Wy(2)
则对于线性变换T,有 T ( v ⃗ ) = T ( x 1 v ⃗ 1 + x 2 v ⃗ 2 + … + x n v ⃗ n ) T\left(\vec{v}\right)=T(x_1{\vec{v}}_1+x_2{\vec{v}}_2+\ldots+x_n{\vec{v}}_n) T(v )=T(x1v 1+x2v 2++xnv n),根据线性变换的性质,
可得
T ( v ⃗ ) = x 1 T ( v ⃗ 1 ) + x 2 T ( v ⃗ 2 ) + … + x n T ( v ⃗ n ) T\left(\vec{v}\right)=x_1T\left({\vec{v}}_1\right)+x_2T\left({\vec{v}}_2\right)+\ldots+x_nT({\vec{v}}_n) T(v )=x1T(v 1)+x2T(v 2)++xnT(v n)

T ( v ⃗ ) = x 1 ′ v ⃗ 1 + x 2 ′ v ⃗ 2 + … + x n ′ v ⃗ n T\left(\vec{v}\right)=x^{'}_1{\vec{v}}_1+x^{'}_2{\vec{v}}_2+\ldots+x^{'}_n{\vec{v}}_n T(v )=x1v 1+x2v 2++xnv n

其中 ( x 1 ′ , x 2 ′ … x n ′ ) (x^{'}_1,x^{'}_2\ldots x^{'}_n) (x1,x2xn) T ( v ⃗ ) T\left(\vec{v}\right) T(v )在基 v ⃗ 1 , v ⃗ 2 … … v ⃗ n {\vec{v}}_1,{\vec{v}}_2\ldots\ldots{\vec{v}}_n v 1,v 2v n中的坐标。
T ( v 1 ⃗ ) = a 11 v ⃗ 1 + a 21 v ⃗ 2 + … + a n 1 v ⃗ n T\left(\vec{v_1}\right)=a_{11}{\vec{v}}_1+a_{21}{\vec{v}}_2+\ldots+a_{n1}{\vec{v}}_n T(v1 )=a11v 1+a21v 2++an1v n
T ( v 2 ⃗ ) = a 12 v ⃗ 1 + a 22 v ⃗ 2 + … + a n 2 v ⃗ n T\left(\vec{v_2}\right)=a_{12}{\vec{v}}_1+a_{22}{\vec{v}}_2+\ldots+a_{n2}{\vec{v}}_n T(v2 )=a12v 1+a22v 2++an2v n
… \ldots
T ( v n ⃗ ) = a 1 n v ⃗ 1 + a 2 n v ⃗ 2 + … + a n n v ⃗ n T\left(\vec{v_n}\right)=a_{1n}{\vec{v}}_1+a_{2n}{\vec{v}}_2+\ldots+a_{nn}{\vec{v}}_n T(vn )=a1nv 1+a2nv 2++annv n

记矩阵 A n × n = [ a 11 ⋯ a 1 n ⋮ ⋱ ⋮ a n 1 … a n n ] A_{n\times n}=[\begin{matrix}a_{11}&\cdots&a_{1n}\\\vdots&\ddots&\vdots\\a_{n1}&\ldots&a_{nn}\\\end{matrix}] An×n=[a11an1a1nann],称矩阵A为线性变换 T T T在基 v ⃗ 1 , v ⃗ 2 … … v ⃗ n {\vec{v}}_1,{\vec{v}}_2\ldots\ldots{\vec{v}}_n v 1,v 2v n下的矩阵。

则对 v ⃗ \vec{v} v 的线性变换 T ( v ⃗ ) T(\vec{v}) T(v )可表示为 T ( x ) = A n × n x T(x)=A_{n\times n}{x} T(x)=An×nx.

其中 x 和 T ( x ) x和T(x) xT(x)表示 v ⃗ 和 T ( v ⃗ ) 在 基 v ⃗ 1 , v ⃗ 2 … … v ⃗ n 下 的 坐 标 , \vec{v}和T\left(\vec{v}\right)在基{\vec{v}}_1,{\vec{v}}_2\ldots\ldots{\vec{v}}_n下的坐标, v T(v )v 1,v 2v n,

x = [ x 1 , x 2 … x n ] T , x i ∈ R {x}=[x_1,x_2…x_n]^T,x_i\in\R x=[x1,x2xn]T,xiR
T ( x ) = [ x 1 ′ , x 2 ′ … x n ′ ] T , x i ′ ∈ R T\left(x\right)=[x^{'}_1,x^{'}_2…x^{'}_n]^T,x^{'}_i\in\R T(x)=[x1,x2xn]T,xiR

这就是线性变换的矩阵表达,由此可见,同一个线性变换 T T T在不同基下的矩阵表达是不同的。

注意一种特殊的变换 T ( v ⃗ ) = v ⃗ T\left(\vec{v}\right)=\vec{v} T(v )=v ,这是一个恒等变换,当输入基和输出基都是同一组基时,如自然基,对应的变换矩阵 A A A是单位矩阵 I I I,然而输入基与输出基不同时,恒等变换矩阵将不是单位矩阵 I I I

观察基向量 w ⃗ 1 {\vec{w}}_1 w 1,这个向量可由 空 间 M 空间M M中的另一组基的线性组合表示,即


w 1 ⃗ = c 11 v ⃗ 1 + c 21 v ⃗ 2 + … + c n 1 v ⃗ n \vec{w_1}=c_{11}{\vec{v}}_1+c_{21}{\vec{v}}_2+\ldots+c_{n1}{\vec{v}}_n w1 =c11v 1+c21v 2++cn1v n

则可得
[ w ⃗ 1 , w ⃗ 2 … … w ⃗ n ] = [ v ⃗ 1 , v ⃗ 2 … … v ⃗ n ] [ c 11 ⋯ c 1 n ⋮ ⋱ ⋮ c n 1 … c n n ] [{\vec{w}}_1,{\vec{w}}_2\ldots\ldots{\vec{w}}_n]=\left[{\vec{v}}_1,{\vec{v}}_2\ldots\ldots{\vec{v}}_n\right][\begin{matrix}c_{11}&\cdots&c_{1n}\\\vdots&\ddots&\vdots\\c_{n1}&\ldots&c_{nn}\\\end{matrix}] [w 1,w 2w n]=[v 1,v 2v n][c11cn1c1ncnn]

记为 W = V C W=VC W=VC,矩阵 C C C称为由基 v ⃗ 1 , v ⃗ 2 … … v ⃗ n {\vec{v}}_1,{\vec{v}}_2\ldots\ldots{\vec{v}}_n v 1,v 2v n到基 w ⃗ 1 , w ⃗ 2 … … w ⃗ n {\vec{w}}_1,{\vec{w}}_2\ldots\ldots{\vec{w}}_n w 1,w 2w n的过渡矩阵,并且矩阵 C C C是可逆的,即 C − 1 C^{-1} C1存在。这便是基变换公式。

因为V,W中的列线性无关,所以矩阵可逆,则有

V x = W y 且 W = V C Vx=Wy且W=VC Vx=WyW=VC

可得

x = C y x=Cy x=Cy y = C − 1 x y=C^{-1}x y=C1x

这便是坐标变换公式。

若有错误,欢迎指正。

参考文献
[1] 方保镕,周继东,李医民.矩阵论(第2版)[M].清华大学出版社

你可能感兴趣的:(线性代数,数学)