前置定义 1 设 T T T 是线性空间 V n V_n Vn 中的线性变换,在 V n V_n Vn 中取定一个基 α 1 , α 2 , ⋯ , α n \boldsymbol{\alpha}_1,\boldsymbol{\alpha}_2,\cdots,\boldsymbol{\alpha}_n α1,α2,⋯,αn,如果这个基在变换 T T T 下的像(用这个基线性表示)为
{ T ( α 1 ) = a 11 α 1 + a 21 α 2 + ⋯ + a n 1 α n ) T ( α 2 ) = a 12 α 1 + a 22 α 2 + ⋯ + a n 2 α n ) ⋯ ⋯ ⋯ T ( α n ) = a 1 n α 1 + a 2 n α 2 + ⋯ + a n n α n ) (1) \left\{ \begin{aligned} & T(\boldsymbol{\alpha}_1) = a_{11} \boldsymbol{\alpha}_1 + a_{21} \boldsymbol{\alpha}_2 + \cdots + a_{n1} \boldsymbol{\alpha}_n) \\ & T(\boldsymbol{\alpha}_2) = a_{12} \boldsymbol{\alpha}_1 + a_{22} \boldsymbol{\alpha}_2 + \cdots + a_{n2} \boldsymbol{\alpha}_n) \\ & \cdots \cdots \cdots \\ & T(\boldsymbol{\alpha}_n) = a_{1n} \boldsymbol{\alpha}_1 + a_{2n} \boldsymbol{\alpha}_2 + \cdots + a_{nn} \boldsymbol{\alpha}_n) \\ \end{aligned} \right. \tag{1} ⎩⎪⎪⎪⎪⎨⎪⎪⎪⎪⎧T(α1)=a11α1+a21α2+⋯+an1αn)T(α2)=a12α1+a22α2+⋯+an2αn)⋯⋯⋯T(αn)=a1nα1+a2nα2+⋯+annαn)(1)
记 T ( α 1 , α 2 , ⋯ , α n ) = ( T ( α 1 ) , T ( α 2 ) , ⋯ , T ( α n ) ) T(\boldsymbol{\alpha}_1,\boldsymbol{\alpha}_2,\cdots,\boldsymbol{\alpha}_n) = (T(\boldsymbol{\alpha}_1), T(\boldsymbol{\alpha}_2), \cdots, T(\boldsymbol{\alpha}_n)) T(α1,α2,⋯,αn)=(T(α1),T(α2),⋯,T(αn)),则上式 ( 6 ) (6) (6) 可表示为
T ( α 1 , α 2 , ⋯ , α n ) = ( α 1 , α 2 , ⋯ , α n ) A (2) T(\boldsymbol{\alpha}_1,\boldsymbol{\alpha}_2,\cdots,\boldsymbol{\alpha}_n) = (\boldsymbol{\alpha}_1,\boldsymbol{\alpha}_2,\cdots,\boldsymbol{\alpha}_n) \boldsymbol{A} \tag{2} T(α1,α2,⋯,αn)=(α1,α2,⋯,αn)A(2)
其中
A = ( a 11 a 12 ⋯ a 1 n a 21 a 22 ⋯ a 2 n ⋮ ⋮ ⋮ a n 1 a n 2 ⋯ a n n ) \boldsymbol{A} = \begin{pmatrix} a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & & \vdots \\ a_{n1} & a_{n2} & \cdots & a_{nn} \\ \end{pmatrix} A=⎝⎜⎜⎜⎛a11a21⋮an1a12a22⋮an2⋯⋯⋯a1na2n⋮ann⎠⎟⎟⎟⎞
那么, A \boldsymbol{A} A 就称为 线性变换 T T T 在基 α 1 , α 2 , ⋯ , α n \boldsymbol{\alpha}_1,\boldsymbol{\alpha}_2,\cdots,\boldsymbol{\alpha}_n α1,α2,⋯,αn 下的矩阵。
定义详 “【推导】线性变换的矩阵表达式”。
根据前置定义 1,显然,矩阵 A \boldsymbol{A} A 由基的像 T ( α 1 ) , ⋯ , T ( α n ) T(\boldsymbol{\alpha}_1),\cdots,T(\boldsymbol{\alpha}_n) T(α1),⋯,T(αn) 唯一确定,即由线性变换 T T T 可唯一地确定一个矩阵 A \boldsymbol{A} A。下面推导由一个矩阵 A \boldsymbol{A} A 也可唯一地确定一个线性变换 T T T。
将 V n \boldsymbol{V}_n Vn 中的任意元素记为 α = ∑ i = 1 n x i α i \boldsymbol{\alpha} = \sum_{i=1}^n x_i \boldsymbol{\alpha}_i α=∑i=1nxiαi,根据前置定义 1 的式 ( 2 ) (2) (2),有
T ( ∑ i = 1 n x i α i ) = ∑ i = 1 n x i T ( α i ) = ( T ( α 1 ) , T ( α 2 ) , ⋯ , T ( α n ) ) ( x 1 x 2 ⋮ x n ) = ( α 1 , α 2 , ⋯ , α n ) A ( x 1 x 2 ⋮ x n ) \begin{aligned} T(\sum_{i=1}^n x_i \boldsymbol{\alpha}_i) & = \sum_{i=1}^n x_i T(\boldsymbol{\alpha}_i) \\ & = (T(\boldsymbol{\alpha}_1),T(\boldsymbol{\alpha}_2),\cdots,T(\boldsymbol{\alpha}_n)) \begin{pmatrix} x_1 \\ x_2 \\ \vdots \\ x_n\end{pmatrix} \\ & = (\boldsymbol{\alpha}_1, \boldsymbol{\alpha}_2, \cdots, \boldsymbol{\alpha}_n) \boldsymbol{A} \begin{pmatrix} x_1 \\ x_2 \\ \vdots \\ x_n\end{pmatrix} \end{aligned} T(i=1∑nxiαi)=i=1∑nxiT(αi)=(T(α1),T(α2),⋯,T(αn))⎝⎜⎜⎜⎛x1x2⋮xn⎠⎟⎟⎟⎞=(α1,α2,⋯,αn)A⎝⎜⎜⎜⎛x1x2⋮xn⎠⎟⎟⎟⎞
即
T [ ( α 1 , α 2 , ⋯ , α n ) ( x 1 x 2 ⋮ x n ) ] = ( α 1 , α 2 , ⋯ , α n ) A ( x 1 x 2 ⋮ x n ) (3) T \left[ (\boldsymbol{\alpha}_1, \boldsymbol{\alpha}_2, \cdots, \boldsymbol{\alpha}_n) \begin{pmatrix} x_1 \\ x_2 \\ \vdots \\ x_n\end{pmatrix} \right] = (\boldsymbol{\alpha}_1, \boldsymbol{\alpha}_2, \cdots, \boldsymbol{\alpha}_n) \boldsymbol{A} \begin{pmatrix} x_1 \\ x_2 \\ \vdots \\ x_n\end{pmatrix} \tag{3} T⎣⎢⎢⎢⎡(α1,α2,⋯,αn)⎝⎜⎜⎜⎛x1x2⋮xn⎠⎟⎟⎟⎞⎦⎥⎥⎥⎤=(α1,α2,⋯,αn)A⎝⎜⎜⎜⎛x1x2⋮xn⎠⎟⎟⎟⎞(3)
上式 ( 3 ) (3) (3) 唯一地确定一个变换 T T T,可以验证确定的变换 T T T 是以 A \boldsymbol{A} A 为矩阵的线性变换。总之,以 A \boldsymbol{A} A 为矩阵的线性变换 T T T 由关系式 ( 3 ) (3) (3) 唯一确定。
综上所述,线性变换与矩阵之间有一一对应的关系。
由关系式 ( 3 ) (3) (3),可见 α \boldsymbol{\alpha} α 与 T ( α ) T(\boldsymbol{\alpha}) T(α) 在基 α 1 , α 2 , ⋯ , α n \boldsymbol{\alpha}_1, \boldsymbol{\alpha}_2, \cdots, \boldsymbol{\alpha}_n α1,α2,⋯,αn 下的坐标分别为
α = ( x 1 x 2 ⋮ x n ) , T ( α ) = A ( x 1 x 2 ⋮ x n ) \boldsymbol{\alpha} = \begin{pmatrix} x_1 \\ x_2 \\ \vdots \\ x_n \end{pmatrix}, \hspace{1em} T(\boldsymbol{\alpha}) = \boldsymbol{A} \begin{pmatrix} x_1 \\ x_2 \\ \vdots \\ x_n \end{pmatrix} α=⎝⎜⎜⎜⎛x1x2⋮xn⎠⎟⎟⎟⎞,T(α)=A⎝⎜⎜⎜⎛x1x2⋮xn⎠⎟⎟⎟⎞
即按坐标表示,有
T ( α ) = A α T(\boldsymbol{\alpha}) = \boldsymbol{A} \boldsymbol{\alpha} T(α)=Aα