线性变换是一种特殊的线性映射,是线性空间到自身的映射。设n维线性空间 M M M上的线性变换 T T T,对任意向量 v ⃗ ∈ M \vec{v}\in M v ∈M,取一组线性无关的基 v ⃗ 1 , v ⃗ 2 … … v ⃗ n ∈ M {\vec{v}}_1,{\vec{v}}_2\ldots\ldots{\vec{v}}_n\in M v 1,v 2……v n∈M,有
v ⃗ = x 1 v ⃗ 1 + x 2 v ⃗ 2 + … + x n v ⃗ n \vec{v}=x_1{\vec{v}}_1+x_2{\vec{v}}_2+\ldots+x_n{\vec{v}}_n v =x1v 1+x2v 2+…+xnv n
即
v ⃗ \vec{v} v 在基
v ⃗ 1 , v ⃗ 2 … … v ⃗ n ∈ M {\vec{v}}_1,{\vec{v}}_2\ldots\ldots{\vec{v}}_n\in M v 1,v 2……v n∈M中的坐标为
( x 1 , x 2 … x n ) (x_1,x_2\ldots x_n) (x1,x2…xn),记为
v ⃗ = V x ⋯ ⋯ ( 1 ) \vec{v}=Vx\cdots\cdots(1) v =Vx⋯⋯(1)。
取一组线性无关的基
w ⃗ 1 , w ⃗ 2 … … w ⃗ n ∈ M {\vec{w}}_1,{\vec{w}}_2\ldots\ldots{\vec{w}}_n\in M w 1,w 2……w n∈M,
有
v ⃗ = y 1 w ⃗ 1 + y 2 w ⃗ 2 + … + y n w ⃗ n \vec{v}=y_1{\vec{w}}_1+y_2{\vec{w}}_2+\ldots+y_n{\vec{w}}_n v =y1w 1+y2w 2+…+ynw n
即
v ⃗ \vec{v} v 在基
w ⃗ 1 {\vec{w}}_1 w 1,
w ⃗ 2 … … w ⃗ n ∈ M {\vec{w}}_2\ldots\ldots{\vec{w}}_n\in M w 2……w n∈M中的坐标为
( y 1 , y 2 … y n ) (y_1,y_2\ldots y_n) (y1,y2…yn),记为
v ⃗ = W y ⋯ ⋯ ( 2 ) \vec{v}=Wy\cdots\cdots(2) v =Wy⋯⋯(2)。
则对于线性变换T,有
T ( v ⃗ ) = T ( x 1 v ⃗ 1 + x 2 v ⃗ 2 + … + x n v ⃗ n ) T\left(\vec{v}\right)=T(x_1{\vec{v}}_1+x_2{\vec{v}}_2+\ldots+x_n{\vec{v}}_n) T(v )=T(x1v 1+x2v 2+…+xnv n),根据线性变换的性质,
可得
T ( v ⃗ ) = x 1 T ( v ⃗ 1 ) + x 2 T ( v ⃗ 2 ) + … + x n T ( v ⃗ n ) T\left(\vec{v}\right)=x_1T\left({\vec{v}}_1\right)+x_2T\left({\vec{v}}_2\right)+\ldots+x_nT({\vec{v}}_n) T(v )=x1T(v 1)+x2T(v 2)+…+xnT(v n)
且
T ( v ⃗ ) = x 1 ′ v ⃗ 1 + x 2 ′ v ⃗ 2 + … + x n ′ v ⃗ n T\left(\vec{v}\right)=x^{'}_1{\vec{v}}_1+x^{'}_2{\vec{v}}_2+\ldots+x^{'}_n{\vec{v}}_n T(v )=x1′v 1+x2′v 2+…+xn′v n
其中
( x 1 ′ , x 2 ′ … x n ′ ) (x^{'}_1,x^{'}_2\ldots x^{'}_n) (x1′,x2′…xn′)是
T ( v ⃗ ) T\left(\vec{v}\right) T(v )在基
v ⃗ 1 , v ⃗ 2 … … v ⃗ n {\vec{v}}_1,{\vec{v}}_2\ldots\ldots{\vec{v}}_n v 1,v 2……v n中的坐标。
令
T ( v 1 ⃗ ) = a 11 v ⃗ 1 + a 21 v ⃗ 2 + … + a n 1 v ⃗ n T\left(\vec{v_1}\right)=a_{11}{\vec{v}}_1+a_{21}{\vec{v}}_2+\ldots+a_{n1}{\vec{v}}_n T(v1 )=a11v 1+a21v 2+…+an1v n
T ( v 2 ⃗ ) = a 12 v ⃗ 1 + a 22 v ⃗ 2 + … + a n 2 v ⃗ n T\left(\vec{v_2}\right)=a_{12}{\vec{v}}_1+a_{22}{\vec{v}}_2+\ldots+a_{n2}{\vec{v}}_n T(v2 )=a12v 1+a22v 2+…+an2v n
… \ldots …
T ( v n ⃗ ) = a 1 n v ⃗ 1 + a 2 n v ⃗ 2 + … + a n n v ⃗ n T\left(\vec{v_n}\right)=a_{1n}{\vec{v}}_1+a_{2n}{\vec{v}}_2+\ldots+a_{nn}{\vec{v}}_n T(vn )=a1nv 1+a2nv 2+…+annv n
记矩阵
A n × n = [ a 11 ⋯ a 1 n ⋮ ⋱ ⋮ a n 1 … a n n ] A_{n\times n}=[\begin{matrix}a_{11}&\cdots&a_{1n}\\\vdots&\ddots&\vdots\\a_{n1}&\ldots&a_{nn}\\\end{matrix}] An×n=[a11⋮an1⋯⋱…a1n⋮ann],称矩阵A为线性变换
T T T在基
v ⃗ 1 , v ⃗ 2 … … v ⃗ n {\vec{v}}_1,{\vec{v}}_2\ldots\ldots{\vec{v}}_n v 1,v 2……v n下的矩阵。
则对 v ⃗ \vec{v} v 的线性变换 T ( v ⃗ ) T(\vec{v}) T(v )可表示为 T ( x ) = A n × n x T(x)=A_{n\times n}{x} T(x)=An×nx.
其中 x 和 T ( x ) x和T(x) x和T(x)表示 v ⃗ 和 T ( v ⃗ ) 在 基 v ⃗ 1 , v ⃗ 2 … … v ⃗ n 下 的 坐 标 , \vec{v}和T\left(\vec{v}\right)在基{\vec{v}}_1,{\vec{v}}_2\ldots\ldots{\vec{v}}_n下的坐标, v 和T(v )在基v 1,v 2……v n下的坐标,
x = [ x 1 , x 2 … x n ] T , x i ∈ R {x}=[x_1,x_2…x_n]^T,x_i\in\R x=[x1,x2…xn]T,xi∈R
T ( x ) = [ x 1 ′ , x 2 ′ … x n ′ ] T , x i ′ ∈ R T\left(x\right)=[x^{'}_1,x^{'}_2…x^{'}_n]^T,x^{'}_i\in\R T(x)=[x1′,x2′…xn′]T,xi′∈R
这就是线性变换的矩阵表达,由此可见,同一个线性变换
T T T在不同基下的矩阵表达是不同的。
注意一种特殊的变换 T ( v ⃗ ) = v ⃗ T\left(\vec{v}\right)=\vec{v} T(v )=v ,这是一个恒等变换,当输入基和输出基都是同一组基时,如自然基,对应的变换矩阵 A A A是单位矩阵 I I I,然而输入基与输出基不同时,恒等变换矩阵将不是单位矩阵 I I I。
观察基向量 w ⃗ 1 {\vec{w}}_1 w 1,这个向量可由 空 间 M 空间M 空间M中的另一组基的线性组合表示,即
w 1 ⃗ = c 11 v ⃗ 1 + c 21 v ⃗ 2 + … + c n 1 v ⃗ n \vec{w_1}=c_{11}{\vec{v}}_1+c_{21}{\vec{v}}_2+\ldots+c_{n1}{\vec{v}}_n w1 =c11v 1+c21v 2+…+cn1v n
则可得
[ w ⃗ 1 , w ⃗ 2 … … w ⃗ n ] = [ v ⃗ 1 , v ⃗ 2 … … v ⃗ n ] [ c 11 ⋯ c 1 n ⋮ ⋱ ⋮ c n 1 … c n n ] [{\vec{w}}_1,{\vec{w}}_2\ldots\ldots{\vec{w}}_n]=\left[{\vec{v}}_1,{\vec{v}}_2\ldots\ldots{\vec{v}}_n\right][\begin{matrix}c_{11}&\cdots&c_{1n}\\\vdots&\ddots&\vdots\\c_{n1}&\ldots&c_{nn}\\\end{matrix}] [w 1,w 2……w n]=[v 1,v 2……v n][c11⋮cn1⋯⋱…c1n⋮cnn]
记为 W = V C W=VC W=VC,矩阵 C C C称为由基 v ⃗ 1 , v ⃗ 2 … … v ⃗ n {\vec{v}}_1,{\vec{v}}_2\ldots\ldots{\vec{v}}_n v 1,v 2……v n到基 w ⃗ 1 , w ⃗ 2 … … w ⃗ n {\vec{w}}_1,{\vec{w}}_2\ldots\ldots{\vec{w}}_n w 1,w 2……w n的过渡矩阵,并且矩阵 C C C是可逆的,即 C − 1 C^{-1} C−1存在。这便是基变换公式。
因为V,W中的列线性无关,所以矩阵可逆,则有
V x = W y 且 W = V C Vx=Wy且W=VC Vx=Wy且W=VC
可得
x = C y x=Cy x=Cy 或 y = C − 1 x y=C^{-1}x y=C−1x
这便是坐标变换公式。
若有错误,欢迎指正。
参考文献
[1] 方保镕,周继东,李医民.矩阵论(第2版)[M].清华大学出版社