向量内积的几何解释

向量内积的几何解释

再看西瓜书中的线性判别分析 LDA,注意到了 w ⊺ x \bm{w}^\intercal \bm{x} wx,说是 “直线上的投影”,于是扒一扒,向量内积怎么就是投影了

给定两个向量 a \bm{a} a b \bm{b} b,我们已经熟练地知道可以求:
( 1 ) (1) (1) 两者之间的夹角余弦 ( 相 似 度 ) (相似度) () c o s ⟨ a , b ⟩ = a ⊺ b ∣ a ∣ ⋅ ∣ b ∣ cos \langle \bm{a}, \bm{b} \rangle = \frac{\bm{a}^\intercal \bm{b}}{|\bm{a}| \cdot |\bm{b}|} cosa,b=abab ( 2 ) (2) (2) a \bm{a} a b \bm{b} b 的投影长度 ∣ a ∣ c o s ⟨ a , b ⟩ = ∣ a ∣ a ⊺ b ∣ a ∣ ⋅ ∣ b ∣ = a ⊺ b ∣ b ∣ = a ⊺ b ∣ b ∣ \begin{aligned} |\bm{a}| cos \langle \bm{a}, \bm{b} \rangle &= |\bm{a}| \frac{\bm{a}^\intercal \bm{b}}{|\bm{a}| \cdot |\bm{b}|} \\ &= \frac{\bm{a}^\intercal \bm{b}}{|\bm{b}|} \\ &= \bm{a}^\intercal \frac{ \bm{b}}{|\bm{b}|} \end{aligned} acosa,b=aabab=bab=abb 但是这里面的内积 a ⊺ b \bm{a}^\intercal \bm{b} ab 究竟是个啥?直觉的几何意义是什么?也许我们从上述两个用途看出向量内积的几何意义:可代表向量之间的夹角,可代表一个向量到另一个向量方向上的投影,但为什么是这样呢?夹角余弦为什么是这么算的?下面我们从向量内积计算的角度解释这是怎么回事。
向量内积的几何解释_第1张图片
先从最简单的二维看看。上图中有两个单位向量 a = ( x , y ) \bm{a} = (x,y) a=(x,y) b = ( c o s β , s i n β ) \bm{b} = (cos\beta, sin\beta) b=(cosβ,sinβ),其中 β \beta β 是向量 b \bm{b} b x x x 轴的夹角。那么 a ⊺ b = x ∗ c o s β + y ∗ s i n β \bm{a}^\intercal \bm{b} = x*cos\beta + y * sin\beta ab=xcosβ+ysinβ 拆开这个式子的两项看看。 O C = x OC = x OC=x C E ⊥ O E CE \perp OE CEOE,红色的线段 O E = O C ∗ c o s β = x ∗ c o s β OE = OC * cos\beta = x * cos\beta OE=OCcosβ=xcosβ A C = y AC = y AC=y E F = C G = y ∗ s i n β EF = CG = y * sin\beta EF=CG=ysinβ,则向量 a \bm{a} a b \bm{b} b 方向的投影长度(黄色线段) O F = O E + E F = x ∗ c o s β + y ∗ s i n β \begin{aligned}OF &= OE + EF\\ &= x*cos\beta + y * sin\beta \end{aligned} OF=OE+EF=xcosβ+ysinβ 这就从几何上直观地解释了为什么向量内积是向量投影长度。注意到 s i n β = c o s ( π 2 − β ) sin\beta = cos(\frac{\pi}{2} - \beta) sinβ=cos(2πβ),那么 O F = x ∗ c o s β + y ∗ c o s ( π 2 − β ) OF = x*cos\beta + y * cos(\frac{\pi}{2} - \beta) OF=xcosβ+ycos(2πβ) 拆开来看, x ∗ c o s β x*cos\beta xcosβ a \bm{a} a x x x 分量 b \bm{b} b 方向上的投影长度,而 y ∗ c o s ( π 2 − β ) y * cos(\frac{\pi}{2} - \beta) ycos(2πβ) y y y 分量 b \bm{b} b 方向上的投影长度,整个内积就是整个向量的投影长度。也就是说,计算向量内积时,对应分量相乘,其实就是分量投影而已。
【注】分量就是向量在各个坐标轴上的投影长度。也可以这么说,向量 a \bm{a} a 先投影到各坐标轴,再从坐标轴投影到向量 b \bm{b} b,再累加。
很明显,更高维的情况也是一样的,各个分量在所投方向的投影累加。至于非单位向量,向量模就是个系数罢了,况且真到实际应用,单位化(normalize)的情况居多。

超平面是在法向量方向上投影相同的点集

我们经常看到超平面的方程是 w ⊺ x + b = 0 \bm{w}^\intercal \bm{x} + b = 0 wx+b=0 下面我们就用向量内积的几何解释来看看超平面的是怎么一回事。
向量内积的几何解释_第2张图片
先从简单的二维平面上的直线开始, w \bm{w} w 是直线的法向量,垂直于直线,很明显,直线上的任意一点 x \bm{x} x 投影到法向量上后 w ⊺ x \bm{w}^\intercal \bm{x} wx 都相等,设为 b b b,当 b = 0 b = 0 b=0 时,直线过原点。三维空间平面也是一样:
向量内积的几何解释_第3张图片
w \bm{w} w 是平面的法向量,垂直于平面,很明显,平面上的任意一点 x \bm{x} x 投影到法向量上后 w ⊺ x \bm{w}^\intercal \bm{x} wx 都相等,设为 b b b,当 b = 0 b = 0 b=0 时,平面过原点。

你可能感兴趣的:(机器学习,算法,线性代数)