线性变换概论

线性变换

定义

V V V W W W 都是在域 K K K上定义的向量空间, T : V → W T :V \rightarrow W T:VW 对任二向量 x , y ∈ V x,y \in V x,yV,与任何标量 a ∈ K a \in K aK,满足:

  • T ( x + y ) = T ( x ) + T ( y ) T(x+y)=T(x)+T(y) T(x+y)=T(x)+T(y)
  • T ( a x ) = a T ( x ) T(ax)=aT(x) T(ax)=aT(x)

T T T 被称为是线性变换

线性算子:从向量空间U映射到U的线性变换

0 0 0变换: 0 ( x ) = 0 0(x)=0 0(x)=0

自身算子: I ( x ) = x I(x)=x I(x)=x

对于 A ∈ R m × n , x ∈ R m × 1 A \in \mathcal{R}^{m \times n},x \in \mathcal{R}^{m \times 1} ARm×n,xRm×1,函数 T ( x ) = A x T(x)=Ax T(x)=Ax是一个从 R n \mathcal{R}^{n} Rn R m \mathcal{R}^{m} Rm线性变换,如果 A A A n × n n \times n n×n的话, T T T是一个线性算子。

B = { u 1 , u 2 , … , u n } \mathcal B =\{ u_1,u_2,\dots,u_n\} B={u1,u2,,un}是向量空间U的一组基,且 v = α 1 u 1 + α 2 u 2 + ⋯ + α n u n v=\alpha_1u_1+\alpha_2u_2+\dots+\alpha_nu_n v=α1u1+α2u2++αnun,则表示为 [ v ] B = ( α 1 , α 2 , … , α n ) T [v]_\mathcal{B}=(\alpha_1,\alpha_2,\dots,\alpha_n)^T [v]B=(α1,α2,,αn)T

A = { e 1 , e 2 , … , e n } \mathcal A =\{ e_1,e_2,\dots,e_n\} A={e1,e2,,en},则被称为向量空间的标准基

线性变换概论_第1张图片

线性变换概论_第2张图片

线性变换概论_第3张图片

B = { x 1 , x 2 , … , x n } \mathcal B=\{x_1,x_2,\dots,x_n\} B={x1,x2,,xn} B ′ = { y 1 , y 2 , … , y n } \mathcal B'=\{y_1,y_2,\dots,y_n\} B={y1,y2,,yn}分别为向量空间 V V V的两组基,其中存在一个变换 A A A在基 B \mathcal B B的表示,则 [ A ] B ′ = [ A [ x 1 ] B ′ , A [ x 2 ] B ′ , … , A [ x n ] B ′ ] [A]_\mathcal{B'}=[A[x_1]_{\mathcal{B'}},A[x_2]_\mathcal{B'},\dots,A[x_n]_\mathcal{B'}] [A]B=[A[x1]B,A[x2]B,,A[xn]B]表示

线性变换概论_第4张图片

其中 [ I ] B ′ B [I]_{\mathcal {B'B}} [I]BB为在向量空间上基向量 B ′ \mathcal B' B B \mathcal B B表示

线性变换概论_第5张图片

例题1

T T T R 3 R^3 R3 的一个线性算子,其定义为 T ( x , y , z ) = ( x − y , y − x , x − z ) T(x, y, z) = (x−y, y−x, x−z) T(x,y,z)=(xy,yx,xz) , B = { u 1 = ( 1 0 1 ) , u 2 = ( 0 1 1 ) , u 3 = ( 1 1 0 ) } \mathcal B=\left\{u_1=\begin{pmatrix}1\\0\\1\end{pmatrix},u_2=\begin{pmatrix}0\\1\\1\end{pmatrix},u_3=\begin{pmatrix}1\\1\\0\end{pmatrix} \right\} B= u1= 101 ,u2= 011 ,u3= 110 为其一组基, v = ( 1 1 0 ) v=\begin{pmatrix}1\\1\\0\end{pmatrix} v= 110 R 3 R^3 R3的一个向量。

1)分别计算 [ T ] B [T]_{\mathcal{B}} [T]B [ v ] B [v]_{\mathcal{B}} [v]B

2)计算 [ T ( v ) ] B [T(v)]_{\mathcal{B}} [T(v)]B,并验证 [ T ( v ) ] B = [ T ] B [ v ] B [T(v)]_{\mathcal{B}}=[T]_{\mathcal{B}}[v]_{\mathcal{B}} [T(v)]B=[T]B[v]B 成立。

1)

首先我们计算 [ T ] B [T]_{\mathcal{B}} [T]B,它是由 T T T作用在基向量上得到的各结果的坐标向量

[ T ( u i ) ] B [T(u_i)]_{\mathcal{B}} [T(ui)]B i = 1 , 2 , 3 i=1,2,3 i=1,2,3)组成。即 [ T ( u 1 ) ] B = [ T ( 1 , 0 , 1 ) ] B = [ ( 1 , − 1 , 0 ) ] B , [ T ( u 2 ) ] B = [ T ( 0 , 1 , 1 ) ] B = [ ( − 1 , 1 , − 1 ) ] B , [ T ( u 3 ) ] B = [ T ( 1 , 1 , 0 ) ] B = [ ( 0 , 0 , 1 ) ] B . \begin{align*} [T(u_1)]_{\mathcal{B}} &=[T(1,0,1)]_{\mathcal{B}}=[(1, -1, 0)]_{\mathcal{B}},\\ [T(u_2)]_{\mathcal{B}} &=[T(0,1,1)]_{\mathcal{B}}=[(-1, 1, -1)]_{\mathcal{B}},\\ [T(u_3)]_{\mathcal{B}} &=[T(1,1,0)]_{\mathcal{B}}=[(0, 0, 1)]_{\mathcal{B}}. \end{align*} [T(u1)]B[T(u2)]B[T(u3)]B=[T(1,0,1)]B=[(1,1,0)]B,=[T(0,1,1)]B=[(1,1,1)]B,=[T(1,1,0)]B=[(0,0,1)]B.

将以上各向量转化为 B \mathcal{B} B下的坐标向量需要解以下方程:

For [ T ( u 1 ) ] B [T(u_1)]_{\mathcal{B}} [T(u1)]B: ( 1 − 1 0 ) = a ( 1 0 1 ) + b ( 0 1 1 ) + c ( 1 1 0 ) . \begin{pmatrix}1\\-1\\0\end{pmatrix}=a\begin{pmatrix}1\\0\\1\end{pmatrix}+b\begin{pmatrix}0\\1\\1\end{pmatrix}+c\begin{pmatrix}1\\1\\0\end{pmatrix}. 110 =a 101 +b 011 +c 110 .

解得: a = 1 , b = − 1 , c = 0 a=1,b=-1,c=0 a=1,b=1,c=0

For [ T ( u 2 ) ] B [T(u_2)]_{\mathcal{B}} [T(u2)]B: ( − 1 1 − 1 ) = a ( 1 0 1 ) + b ( 0 1 1 ) + c ( 1 1 0 ) . \begin{pmatrix}-1\\1\\-1\end{pmatrix}=a\begin{pmatrix}1\\0\\1\end{pmatrix}+b\begin{pmatrix}0\\1\\1\end{pmatrix}+c\begin{pmatrix}1\\1\\0\end{pmatrix}. 111 =a 101 +b 011 +c 110 .

解得: a = − 3 2 , b = 1 2 , c = 1 2 a=-\frac{3}{2},b=\frac{1}{2},c=\frac{1}{2} a=23,b=21,c=21

For [ T ( u 3 ) ] B [T(u_3)]_{\mathcal{B}} [T(u3)]B: ( 0 0 1 ) = a ( 1 0 1 ) + b ( 0 1 1 ) + c ( 1 1 0 ) . \begin{pmatrix}0\\0\\1\end{pmatrix}=a\begin{pmatrix}1\\0\\1\end{pmatrix}+b\begin{pmatrix}0\\1\\1\end{pmatrix}+c\begin{pmatrix}1\\1\\0\end{pmatrix}. 001 =a 101 +b 011 +c 110 .

解得: a = 1 2 , b = 1 2 , c = − 1 2 a=\frac{1}{2},b=\frac{1}{2},c=-\frac{1}{2} a=21,b=21,c=21

解以上各方程,我们可以得到对应的坐标向量。

此外,我们还需要求 R 3 R^3 R3中的向量 v v v在基 B \mathcal{B} B上的坐标向量 [ v ] B [v]_{\mathcal{B}} [v]B, 它可通过解以下方程得出 ( 1 1 0 ) = a ( 1 0 1 ) + b ( 0 1 1 ) + c ( 1 1 0 ) = a u 1 + b u 2 + c u 3 \begin{pmatrix}1\\1\\0\end{pmatrix}=a\begin{pmatrix}1\\0\\1\end{pmatrix}+b\begin{pmatrix}0\\1\\1\end{pmatrix}+c\begin{pmatrix}1\\1\\0\end{pmatrix} = a u_1 + b u_2 + c u_3 110 =a 101 +b 011 +c 110 =au1+bu2+cu3

解得: a = 1 , b = 1 , c = 0 a=1,b=1,c=0 a=1,b=1,c=0

综上所述:

[ T ] B = [ 1 − 3 2 1 2 − 1 1 2 1 2 0 1 2 − 1 2 ] [T]_{\mathcal{B}}=\begin{bmatrix}1&-\frac{3}{2}& \frac{1}{2}\\-1&\frac{1}{2}&\frac{1}{2}\\0&\frac{1}{2}&-\frac{1}{2}\end{bmatrix} [T]B= 110232121212121

[ v ] B = [ 1 1 0 ] [v]_{\mathcal{B}}=\begin{bmatrix}1\\1\\0\end{bmatrix} [v]B= 110

2)

T ( v ) = ( 0 0 − 1 ) T(v)=\begin{pmatrix}0\\0\\-1\end{pmatrix} T(v)= 001

[ T ( v ) ] B = a ( 1 0 1 ) + b ( 0 1 1 ) + c ( 1 1 0 ) [T(v)]_{\mathcal{B}}=a\begin{pmatrix}1\\0\\1\end{pmatrix}+b\begin{pmatrix}0\\1\\1\end{pmatrix}+c\begin{pmatrix}1\\1\\0\end{pmatrix} [T(v)]B=a 101 +b 011 +c 110

解得 [ T ( v ) ] b = ( − 1 2 − 1 2 1 2 ) [T(v)]_\mathcal{b}=\begin{pmatrix}-\frac{1}{2}\\-\frac{1}{2}\\\frac{1}{2}\end{pmatrix} [T(v)]b= 212121

所以 [ T ( v ) ] B = [ T ] B [ v ] B [T(v)]_{\mathcal{B}}=[T]_{\mathcal{B}}[v]_{\mathcal{B}} [T(v)]B=[T]B[v]B

例题2

A ( x , y , z ) = ( x + 2 y − z , − y , x + 7 z ) A(x,y,z)=(x+2y-z,-y,x+7z) A(x,y,z)=(x+2yz,y,x+7z) R 3 R^3 R3 的一个线性算子,其定义为 T ( x , y , z ) = ( x − y , y − x , x − z ) T(x, y, z) = (x−y, y−x, x−z) T(x,y,z)=(xy,yx,xz) , B = { ( 1 0 0 ) , ( 0 1 0 ) , ( 0 0 1 ) } , B ′ = { ( 1 0 0 ) , ( 1 1 0 ) , ( 1 1 1 ) } \mathcal B=\left\{\begin{pmatrix}1\\0\\0\end{pmatrix},\begin{pmatrix}0\\1\\0\end{pmatrix},\begin{pmatrix}0\\0\\1\end{pmatrix} \right\},\mathcal B'=\left\{\begin{pmatrix}1\\0\\0\end{pmatrix},\begin{pmatrix}1\\1\\0\end{pmatrix},\begin{pmatrix}1\\1\\1\end{pmatrix} \right\} B= 100 , 010 , 001 ,B= 100 , 110 , 111 为其一组基, v = ( 1 1 0 ) v=\begin{pmatrix}1\\1\\0\end{pmatrix} v= 110 R 3 R^3 R3的一个向量。

1)分别计算 [ A ] B [A]_{\mathcal{B}} [A]B [ A ] B ′ [A]_{\mathcal{B'}} [A]B

2)求矩阵 Q Q Q,使得 [ A ] B ′ = Q − 1 [ A ] B Q [A]_\mathcal {B'}=Q^{-1}[A]_\mathcal {B}Q [A]B=Q1[A]BQ成立。

首先,我们需要找出在 B \mathcal{B} B B ′ \mathcal{B'} B基下的矩阵 A A A的表示即 [ A ] B [A]_{\mathcal{B}} [A]B [ A ] B ′ [A]_{\mathcal{B'}} [A]B。这一步可以通过将线性变换应用于基向量并将结果写成列向量的形式完成。

线性算子 A A A B \mathcal B B为基的矩阵表示为: [ A ] B = [ A ( 1 , 0 , 0 ) A ( 0 , 1 , 0 ) A ( 0 , 0 , 1 ) ] B [A]_{\mathcal{B}} = \left[ \begin{array}{ccc} A(1,0,0) & A(0,1,0) & A(0,0,1) \\ \end{array} \right]_{\mathcal{B}} [A]B=[A(1,0,0)A(0,1,0)A(0,0,1)]B = [ A ( e 1 ) , A ( e 2 ) , A ( e 3 ) ] B =[A(e_1),A(e_2),A(e_3)]_\mathcal{B} =[A(e1),A(e2),A(e3)]B

计算得到 [ A ] B = [ A ( 1 , 0 , 0 ) A ( 0 , 1 , 0 ) A ( 0 , 0 , 1 ) ] B = [ 1 2 − 1 0 − 1 0 1 0 7 ] [A]_{\mathcal{B}} = \left[ \begin{array}{ccc} A(1,0,0) & A(0,1,0) & A(0,0,1) \\ \end{array} \right]_\mathcal B = \left[ \begin{array}{ccc} 1 & 2 & -1 \\ 0 & -1 & 0 \\ 1 & 0 & 7 \\ \end{array} \right] [A]B=[A(1,0,0)A(0,1,0)A(0,0,1)]B= 101210107

线性算子 A A A B ′ \mathcal B' B为基的矩阵表示为: [ A ] B ′ = [ A ( 1 , 0 , 0 ) A ( 1 , 1 , 0 ) A ( 1 , 1 , 1 ) ] B ′ [A]_{\mathcal{B'}} = \left[ \begin{array}{ccc} A(1,0,0) & A(1,1,0) & A(1,1,1) \\ \end{array} \right] _{\mathcal{B'}} [A]B=[A(1,0,0)A(1,1,0)A(1,1,1)]B = [ A ( e 1 ′ ) , A ( e 2 ′ ) , A ( e 3 ′ ) ] B ′ =[A(e_1'),A(e_2'),A(e_3')]_\mathcal{B'} =[A(e1),A(e2),A(e3)]B

计算得到 [ A ] B ′ = [ A ( 1 , 0 , 0 ) A ( 1 , 1 , 0 ) A ( 1 , 1 , 1 ) ] B ′ = [ 1 4 3 − 1 − 2 9 1 1 8 ] [A]_{\mathcal{B'}} = \left[ \begin{array}{ccc} A(1,0,0) & A(1,1,0) & A(1,1,1) \\ \end{array} \right]_\mathcal {B'} = \left[ \begin{array}{ccc} 1 & 4 & 3 \\ -1 & -2 & 9 \\ 1 & 1 & 8 \\ \end{array} \right] [A]B=[A(1,0,0)A(1,1,0)A(1,1,1)]B= 111421398

接下来求矩阵 Q Q Q,使得 [ A ] B ′ = Q − 1 [ A ] B Q [A]_\mathcal {B'}=Q^{-1}[A]_\mathcal {B}Q [A]B=Q1[A]BQ成立。

我们已经知道 B = { e 1 , e 2 , e 3 } \mathcal{B}=\{e_1,e_2,e_3\} B={e1,e2,e3} B ′ = { e 1 ′ , e 2 ′ , e 3 ′ } \mathcal{B'}=\{e_1',e_2',e_3'\} B={e1,e2,e3}

给出两个基 B \mathcal B B B ′ \mathcal B' B,要找出矩阵 I I I在基 B ′ \mathcal B' B B \mathcal B B之间的表示 [ I ] B ′ B [I]_{\mathcal B' \mathcal B} [I]BB。 第一个基 B \mathcal B B是标准基,我们考虑将 B ′ \mathcal B' B的基向量表示为 B \mathcal B B的线性组合。具体地:

第一个基向量在 B ′ \mathcal B' B中是 ( 1 0 0 ) \begin{pmatrix}1\\0\\0\end{pmatrix} 100 ,这就是 B \mathcal B B的第一个基向量,所以在 B \mathcal B B的基的表示下,首列是 ( 1 , 0 , 0 ) T (1,0,0)^T (1,0,0)T

第二个基向量在 B ′ \mathcal B' B中是 ( 1 1 0 ) \begin{pmatrix}1\\1\\0\end{pmatrix} 110 ,它可以被表示为 B \mathcal B B的第一个和第二个基向量的和,于是在 B \mathcal B B的基的表示下,第二列是 ( 1 , 1 , 0 ) T (1,1,0)^T (1,1,0)T

第三个基向量在 B ′ \mathcal B' B中是 ( 1 1 1 ) \begin{pmatrix}1\\1\\1\end{pmatrix} 111 ,它可以被表示为 B \mathcal B B所有三个基向量的和,所以在 B \mathcal B B的基的表示下,第三列是 ( 1 , 1 , 1 ) T (1,1,1)^T (1,1,1)T

B \mathcal B B的基表示,我们得到: [ I ] B ′ B = ( 1 1 1 0 1 1 0 0 1 ) [I]_{\mathcal B' \mathcal B}=\begin{pmatrix}1&1&1\\0&1&1\\0&0&1\end{pmatrix} [I]BB= 100110111 这就是矩阵 I I I B ′ \mathcal B' B B \mathcal B B之间的线性变换矩阵。

例题三

对于 R 2 × 2 R^{2\times2} R2×2 矩阵,$\mathcal B = \left{ \begin{bmatrix} 1 & 0 \ 0 & 0 \end{bmatrix}, \begin{bmatrix} 0 & 1 \ 0 & 0 \end{bmatrix}, \begin{bmatrix} 0 & 0 \ 1 & 0 \end{bmatrix}, \begin{bmatrix} 0 & 0 \ 0 & 1 \end{bmatrix} \right} $

对其中一组矩阵, 对于该运算中任意矩阵 A A A, 定义映射 T 定义如下:

$T(A) = \frac{A + A^T}{2} $

计算 [ T ] B [T]_\mathcal B [T]B.

首先我们需要了解一下所给出的映射 T T T如何作用于一个矩阵。给定矩阵 A = [ a b c d ] A=\begin{bmatrix} a & b \\ c & d \end{bmatrix} A=[acbd], 我们可以计算:

T ( A ) = A + A T 2 = [ a b c d ] + [ a c b d ] 2 = [ a b + c 2 b + c 2 d ] T(A) = \frac{A + A^T}{2} = \frac{\begin{bmatrix} a & b \\ c & d \end{bmatrix} + \begin{bmatrix} a & c \\ b & d \end{bmatrix}}{2} = \begin{bmatrix} a & \frac{b+c}{2} \\ \frac{b+c}{2} & d \end{bmatrix} T(A)=2A+AT=2[acbd]+[abcd]=[a2b+c2b+cd]

为了找到矩阵 [ T ] B [T]_B [T]B,我们需要将基 B B B中的每一个矩阵分别带入 T T T中,并表示其结果为 B B B基下的坐标。

对于 [ 1 0 0 0 ] \begin{bmatrix} 1 & 0 \\ 0 & 0 \end{bmatrix} [1000]:

T ( [ 1 0 0 0 ] ) = [ 1 0 0 0 ] = 1 ⋅ [ 1 0 0 0 ] + 0 ⋅ [ 0 1 0 0 ] + 0 ⋅ [ 0 0 1 0 ] + 0 ⋅ [ 0 0 0 1 ] T\left( \begin{bmatrix} 1 & 0 \\ 0 & 0 \end{bmatrix} \right) = \begin{bmatrix} 1 & 0 \\ 0 & 0 \end{bmatrix} = 1 \cdot \begin{bmatrix} 1 & 0 \\ 0 & 0 \end{bmatrix} + 0 \cdot \begin{bmatrix} 0 & 1 \\ 0 & 0 \end{bmatrix} + 0 \cdot \begin{bmatrix} 0 & 0 \\ 1 & 0 \end{bmatrix} + 0 \cdot \begin{bmatrix} 0 & 0 \\ 0 & 1 \end{bmatrix} T([1000])=[1000]=1[1000]+0[0010]+0[0100]+0[0001]

所以,第一列为 [ 1 0 0 0 ] \begin{bmatrix} 1 \\ 0 \\ 0 \\ 0 \end{bmatrix} 1000

对于 [ 0 1 0 0 ] \begin{bmatrix} 0 & 1 \\ 0 & 0 \end{bmatrix} [0010]:

T ( [ 0 1 0 0 ] ) = [ 0 0.5 0.5 0 ] = 0 ⋅ [ 1 0 0 0 ] + 0.5 ⋅ [ 0 1 0 0 ] + 0.5 ⋅ [ 0 0 1 0 ] + 0 ⋅ [ 0 0 0 1 ] T\left( \begin{bmatrix} 0 & 1 \\ 0 & 0 \end{bmatrix} \right) = \begin{bmatrix} 0 & 0.5 \\ 0.5 & 0 \end{bmatrix} = 0 \cdot \begin{bmatrix} 1 & 0 \\ 0 & 0 \end{bmatrix} + 0.5 \cdot \begin{bmatrix} 0 & 1 \\ 0 & 0 \end{bmatrix} + 0.5 \cdot \begin{bmatrix} 0 & 0 \\ 1 & 0 \end{bmatrix} + 0 \cdot \begin{bmatrix} 0 & 0 \\ 0 & 1 \end{bmatrix} T([0010])=[00.50.50]=0[1000]+0.5[0010]+0.5[0100]+0[0001]

所以,第二列为 [ 0 0.5 0.5 0 ] \begin{bmatrix} 0 \\ 0.5 \\ 0.5 \\ 0 \end{bmatrix} 00.50.50

对于 [ 0 0 1 0 ] \begin{bmatrix} 0 & 0 \\ 1 & 0 \end{bmatrix} [0100]:

这个矩阵和上一个矩阵相同,所以第三列也是 [ 0 0.5 0.5 0 ] \begin{bmatrix} 0 \\ 0.5 \\ 0.5 \\ 0 \end{bmatrix} 00.50.50

对于 [ 0 0 0 1 ] \begin{bmatrix} 0 & 0 \\ 0 & 1 \end{bmatrix} [0001]:

T ( [ 0 0 0 1 ] ) = [ 0 0 0 1 ] = 0 ⋅ [ 1 0 0 0 ] + 0 ⋅ [ 0 1 0 0 ] + 0 ⋅ [ 0 0 1 0 ] + 1 ⋅ [ 0 0 0 1 ] T\left( \begin{bmatrix} 0 & 0 \\ 0 & 1 \end{bmatrix} \right) = \begin{bmatrix} 0 & 0 \\ 0 & 1 \end{bmatrix} = 0 \cdot \begin{bmatrix} 1 & 0 \\ 0 & 0 \end{bmatrix} + 0 \cdot \begin{bmatrix} 0 & 1 \\ 0 & 0 \end{bmatrix} + 0 \cdot \begin{bmatrix} 0 & 0 \\ 1 & 0 \end{bmatrix} + 1 \cdot \begin{bmatrix} 0 & 0 \\ 0 & 1 \end{bmatrix} T([0001])=[0001]=0[1000]+0[0010]+0[0100]+1[0001]

所以,第四列为 [ 0 0 0 1 ] \begin{bmatrix} 0 \\ 0 \\ 0 \\ 1 \end{bmatrix} 0001

综上, [ T ] B [T]_\mathcal B [T]B为:

[ T ] B = [ 1 0 0 0 0 0.5 0.5 0 0 0.5 0.5 0 0 0 0 1 ] [T]_\mathcal B = \begin{bmatrix} 1 & 0 & 0 & 0 \\ 0 & 0.5 & 0.5 & 0 \\ 0 & 0.5 & 0.5 & 0 \\ 0 & 0 & 0 & 1 \end{bmatrix} [T]B= 100000.50.5000.50.500001

你可能感兴趣的:(矩阵)