《线性代数的本质》 - 3blue1brown
高中数学A版选修4-2 矩阵与变换
《线性代数及其应用》(第五版)
《高等代数简明教程》- 蓝以中
In the beginning Grant created the space. And Grant said, Let there be vector: and there was vector.
三维几何空间中的一个有向线段称为向量(vector)。本文统一用 a , b , c , k , λ a,b,c,k,\lambda a,b,c,k,λ 表示标量,小写黑体字母 u , v , w , a , b , x \mathbf u,\mathbf v,\mathbf w,\mathbf a,\mathbf b,\mathbf x u,v,w,a,b,x 表示向量。
向量通常定义两种运算:加法和数乘。加法遵循三角形法则(平行四边形法则),数乘被称为缩放(scaling)。运算法则如下图
性质:根据向量的几何性质可证明向量的加法和数乘满足以下八条性质:
向量空间是三维几何空间向高维空间的推广。线性代数中,每个向量都以坐标原点为起点,那么任何一个向量就由其终点唯一确定。从而,向量和空间中的点一一对应。因此,空间也可以看成由所有向量组成的集合,并且集合中的元素可以进行加法和数乘运算。于是,便有了向量空间的抽象定义。
向量空间: 设 V V V 为 n n n 维向量的非空集合, F \mathbb F F 是一个数域,若 V V V 对于向量的加法和数乘两种运算封闭,那么称集合 V V V 为数域 F F F 上的向量空间(vector space)。所谓封闭是指
线性代数中的数域通常取全体实数,即 F = R \mathbb F=\R F=R。
例如: n n n维向量的全体生成实数域上的向量空间
R n = { x = ( x 1 , x 2 , ⋯ , x n ) ∣ x 1 , x 2 , ⋯ , x n ∈ R } \R^n=\{\mathbf x=(x_1,x_2,\cdots,x_n)\mid x_1,x_2,\cdots,x_n\in\R\} Rn={x=(x1,x2,⋯,xn)∣x1,x2,⋯,xn∈R}
子空间:设 U U U 是向量空间 V V V 的一个非空子集,如果 U U U中的线性运算封闭,则 U U U 也是向量空间,称为 V V V 的子空间。
仿照解析几何的基本方法,建立一个坐标系,实现空间内的点与有序实数对一一对应,从而空间内的向量与有序实数对也一一对应,这样就可以用代数方法来研究向量的性质。
为方便建立空间的坐标系,先定义几个概念。
定义:取向量空间 V V V 内一个向量组 a 1 , a 2 , ⋯ , a r \mathbf a_1,\mathbf a_2,\cdots,\mathbf a_r a1,a2,⋯,ar
向量 x 1 a 1 + x 2 a 2 + ⋯ + x r a r x_1\mathbf a_1+x_2\mathbf a_2+\cdots+x_r\mathbf a_r x1a1+x2a2+⋯+xrar 称为向量组的一个线性组合(linear combination)
向量组的所有线性组合构成的向量集称为由该向量组张成的空间,记作
span { a 1 , ⋯ , a n } = { x 1 a 1 + ⋯ + x n a n ∣ x 1 , ⋯ , x n ∈ R } \text{span}\{\mathbf a_1,\cdots,\mathbf a_n\}=\{x_1\mathbf a_1+\cdots+x_n\mathbf a_n\mid x_1,\cdots,x_n\in\R\} span{a1,⋯,an}={x1a1+⋯+xnan∣x1,⋯,xn∈R}
如下图,若 u , v ∈ R 3 \mathbf u,\mathbf v\in\R^3 u,v∈R3 不共线,则 span { u , v } \text{span}\{\mathbf u,\mathbf v\} span{u,v} 是 R 3 \R^3 R3中包含 u , v \mathbf u,\mathbf v u,v 和原点的平面,图示
当且仅当系数 x 1 = x 2 = ⋯ = x r = 0 x_1=x_2=\cdots=x_r=0 x1=x2=⋯=xr=0 时,线性组合为零
x 1 a 1 + x 2 a 2 + ⋯ + x r a r = 0 x_1\mathbf a_1+x_2\mathbf a_2+\cdots+x_r\mathbf a_r=0 x1a1+x2a2+⋯+xrar=0
则称向量组线性无关(linearly independence)。反之,如果存在不全为零的数使上式成立,则称向量组线性相关(linearly dependence)。
定理:若向量 v \mathbf v v 可由线性无关的向量组 a 1 , a 2 , ⋯ , a r \mathbf a_1,\mathbf a_2,\cdots,\mathbf a_r a1,a2,⋯,ar 线性表示,则表示系数是唯一的。
证明:设向量 v \mathbf v v 有两组表示系数
b = k 1 a 1 + k 2 a 2 + ⋯ + k r a r b = l 1 a 1 + l 2 a 2 + ⋯ + l r a r \mathbf b=k_1\mathbf a_1+k_2\mathbf a_2+\cdots+k_r\mathbf a_r \\ \mathbf b=l_1\mathbf a_1+l_2\mathbf a_2+\cdots+l_r\mathbf a_r b=k1a1+k2a2+⋯+krarb=l1a1+l2a2+⋯+lrar
则有
( k 1 − l 1 ) a 1 + ( k 1 − l 2 ) a 2 + ⋯ + ( k 1 − l r ) a r = 0 (k_1-l_1)\mathbf a_1+(k_1-l_2)\mathbf a_2+\cdots+(k_1-l_r)\mathbf a_r=0 (k1−l1)a1+(k1−l2)a2+⋯+(k1−lr)ar=0
因为 a 1 , a 2 , ⋯ , a r \mathbf a_1,\mathbf a_2,\cdots,\mathbf a_r a1,a2,⋯,ar 线性无关,故必有
k 1 − l 1 = k 1 − l 1 = ⋯ = k 1 − l 1 = 0 k_1-l_1=k_1-l_1=\cdots=k_1-l_1=0 k1−l1=k1−l1=⋯=k1−l1=0
即表示系数是唯一的。
接下来,我们自然想用一组线性无关的向量来张成整个向量空间。
向量空间的基:张成向量空间 V V V的一个线性无关的向量集合称为该空间的一组基(basis)。基向量组所含向量的个数,称为向量空间 V V V的维数(dimension),记为 dim V \dim V dimV。
可以证明,向量空间的任意一组基的向量个数是相等的。
单由零向量组成的向量空间 { 0 } \{0\} {0}称为零空间。零空间的维数定义为零。
基定理: n n n 维向量空间的任意 n n n 个线性无关的向量构成空间的一组基。
向量空间选定了基向量后,空间中全体向量的集合与全体有序实数组的集合之间就建立了一一 对应的关系。
坐标:设向量组 a 1 , a 2 , ⋯ , a n \mathbf a_1,\mathbf a_2,\cdots,\mathbf a_n a1,a2,⋯,an 是线性空间 V V V 的一组基,则空间内任一向量 v ∈ V \mathbf v\in V v∈V 都可表示为基向量的唯一线性组合
v = x 1 a 1 + x 2 a 2 + ⋯ + x n a n \mathbf v=x_1\mathbf a_1+x_2\mathbf a_2+\cdots+x_n\mathbf a_n v=x1a1+x2a2+⋯+xnan
有序数组 x 1 , x 2 , ⋯ , x n x_1,x_2,\cdots,x_n x1,x2,⋯,xn 称为向量 v \mathbf v v 在基 a 1 , a 2 , ⋯ , a n \mathbf a_1,\mathbf a_2,\cdots,\mathbf a_n a1,a2,⋯,an 下的坐标,一般记作
[ x 1 x 2 ⋮ x n ] or ( x 1 , x 2 , ⋯ , x n ) \begin{bmatrix}x_1\\x_2\\\vdots\\x_n\end{bmatrix}\quad \text{or}\quad (x_1,x_2,\cdots,x_n) ⎣⎢⎢⎢⎡x1x2⋮xn⎦⎥⎥⎥⎤or(x1,x2,⋯,xn)
类似于三维几何空间,由 n n n个有序数构成的向量称为 n n n维向量。
例:设 v 1 = [ 3 6 2 ] , v 2 = [ − 1 0 1 ] , x = [ 3 12 7 ] \mathbf v_1=\begin{bmatrix}3\\6\\2\end{bmatrix},\mathbf v_2=\begin{bmatrix}-1\\0\\1\end{bmatrix},\mathbf x=\begin{bmatrix}3\\12\\7\end{bmatrix} v1=⎣⎡362⎦⎤,v2=⎣⎡−101⎦⎤,x=⎣⎡3127⎦⎤ 。判断 x \mathbf x x 是否在 H = span { v 1 , v 2 } H=\text{span }\{\mathbf v_1,\mathbf v_2\} H=span {v1,v2} 中,如果是,求 x \mathbf x x 相对于基向量 B = { v 1 , v 2 } B=\{\mathbf v_1,\mathbf v_2\} B={v1,v2} 的坐标。
解:如果 x \mathbf x x 在 H = span { v 1 , v 2 } H=\text{span }\{\mathbf v_1,\mathbf v_2\} H=span {v1,v2} 中,则下列方程是有解的
c 1 [ 3 6 2 ] + c 2 [ − 1 0 1 ] = [ 3 12 7 ] c_1\begin{bmatrix}3\\6\\2\end{bmatrix}+c_2\begin{bmatrix}-1\\0\\1\end{bmatrix}=\begin{bmatrix}3\\12\\7\end{bmatrix} c1⎣⎡362⎦⎤+c2⎣⎡−101⎦⎤=⎣⎡3127⎦⎤
如果数 c 1 , c 2 c_1,c_2 c1,c2存在,则它们是 x \mathbf x x 相对于 B B B 的坐标。由初等行变换得
[ 3 − 1 3 6 0 12 2 1 7 ] → [ 1 0 2 0 1 3 0 0 0 ] \begin{bmatrix}\begin{array}{cc:c} 3&-1&3\\6&0&12\\2&1&7 \end{array}\end{bmatrix}\to \begin{bmatrix}\begin{array}{cc:c} 1&0&2\\0&1&3\\0&0&0 \end{array}\end{bmatrix} ⎣⎡362−1013127⎦⎤→⎣⎡100010230⎦⎤
于是, x \mathbf x x 相对于 v 1 , v 2 \mathbf v_1,\mathbf v_2 v1,v2 的坐标
v B = [ 3 2 ] \mathbf v_B=\begin{bmatrix}3\\2\end{bmatrix} vB=[32]
有时为了区分坐标的基向量,向量 v \mathbf v v 在基 B = { b 1 , b 2 , ⋯ , b n } B=\{\mathbf b_1,\mathbf b_2,\cdots,\mathbf b_n\} B={b1,b2,⋯,bn} 下的坐标,记作 v B \mathbf v_B vB
建立了坐标之后, V V V中抽象的向量 v \mathbf v v 和 R n \R^n Rn中具体的数组 ( x 1 , x 2 , ⋯ , x n ) T (x_1,x_2,\cdots,x_n)^T (x1,x2,⋯,xn)T 实现了一一对应,并且向量的线性运算也可以表示为坐标的线性运算。
设 v , w ∈ V \mathbf v,\mathbf w\in V v,w∈V,有
v = v 1 a 1 + v 2 a 2 + ⋯ + v n a n w = w 1 a 1 + w 2 a 2 + ⋯ + w n a n \mathbf v=v_1\mathbf a_1+v_2\mathbf a_2+\cdots+v_n\mathbf a_n\\ \mathbf w=w_1\mathbf a_1+w_2\mathbf a_2+\cdots+w_n\mathbf a_n v=v1a1+v2a2+⋯+vnanw=w1a1+w2a2+⋯+wnan
向量加法运算
v + w = ( v 1 + w 1 ) a 1 + ( v 2 + w 2 ) a 2 + ⋯ + ( v n + w n ) a n \mathbf v+\mathbf w=(v_1+w_1)\mathbf a_1+(v_2+w_2)\mathbf a_2+\cdots+(v_n+w_n)\mathbf a_n v+w=(v1+w1)a1+(v2+w2)a2+⋯+(vn+wn)an
即对应的坐标运算为
[ v 1 v 2 ⋮ v n ] + [ w 1 w 2 ⋮ w n ] = [ v 1 + w 1 v 2 + w 2 ⋮ v n + w n ] \begin{bmatrix}v_1\\ v_2\\ \vdots \\ v_n\end{bmatrix}+ \begin{bmatrix}w_1\\ w_2\\ \vdots \\ w_n\end{bmatrix}= \begin{bmatrix}v_1+w_1\\ v_2+w_2\\ \vdots \\ v_n+w_n\end{bmatrix} ⎣⎢⎢⎢⎡v1v2⋮vn⎦⎥⎥⎥⎤+⎣⎢⎢⎢⎡w1w2⋮wn⎦⎥⎥⎥⎤=⎣⎢⎢⎢⎡v1+w1v2+w2⋮vn+wn⎦⎥⎥⎥⎤
向量数乘运算
c v = ( c v 1 ) a 1 + ( c v 2 ) a 2 + ⋯ + ( c v n ) a n c\mathbf v=(cv_1)\mathbf a_1+(cv_2)\mathbf a_2+\cdots+(cv_n)\mathbf a_n cv=(cv1)a1+(cv2)a2+⋯+(cvn)an
即对应的坐标运算为
c [ v 1 v 2 ⋮ v n ] = [ c v 1 c v 2 ⋮ c v n ] c\begin{bmatrix}v_1\\ v_2\\ \vdots \\ v_n\end{bmatrix}= \begin{bmatrix}cv_1\\ cv_2\\ \vdots \\ cv_n\end{bmatrix} c⎣⎢⎢⎢⎡v1v2⋮vn⎦⎥⎥⎥⎤=⎣⎢⎢⎢⎡cv1cv2⋮cvn⎦⎥⎥⎥⎤
向量的坐标取值依托于坐标系的基向量。选取的基向量不同,其所对应的坐标值就不同。当然,基向量自身的坐标总是:
e 1 = [ 1 0 ⋮ 0 ] , e 2 = [ 0 1 ⋮ 0 ] , ⋯ , e n = [ 0 0 ⋮ 1 ] , \mathbf e_1=\begin{bmatrix}1\\0\\\vdots\\0\end{bmatrix},\quad \mathbf e_2=\begin{bmatrix}0\\1\\\vdots\\0\end{bmatrix},\quad \cdots,\quad \mathbf e_n=\begin{bmatrix}0\\0\\\vdots\\1\end{bmatrix},\quad e1=⎣⎢⎢⎢⎡10⋮0⎦⎥⎥⎥⎤,e2=⎣⎢⎢⎢⎡01⋮0⎦⎥⎥⎥⎤,⋯,en=⎣⎢⎢⎢⎡00⋮1⎦⎥⎥⎥⎤,
这种坐标形式通常称为标准向量组(或单位坐标向量组)。
总之,在 n n n维向量空间 V n V_n Vn 中任取一组基,则 V n V_n Vn 中的向量与 R n \R^n Rn 中的数组之间就有一一对应的关系,且这个对应关系保持线性组合(线性运算)的一一对应。接下来我们将默认使用标准坐标系:坐标原点为 O O O,基向量组为 e 1 , e 2 , ⋯ , e n \mathbf e_1,\mathbf e_2,\cdots,\mathbf e_n e1,e2,⋯,en 。后续将对向量实体和坐标不做区分。