多元微积分(二)--方向导数与梯度

多元微积分(二)–方向导数与梯度

  书接上回(多元微积分(一)–导数与偏导数)我们最后提出了一个问题:二维平面上那么多的方向,我们只研究了单纯沿 x x x的方向和沿 y y y的方向,那么其他方向呢?我们在这篇文章中就来探讨这个问题。
  我们在多元微积分(一)–导数与偏导数这篇文章中还提到了一个本菜鸡自创的公式:
导 数 = l i m d ( 自 变 量 ) − > 0 d ( 因 变 量 ) d ( 自 变 量 ) 导数=lim_{d(自变量)->0}\frac{d(因变量)}{d(自变量)} =limd()>0d()d()
具体含义我们其实在字面上可以理解的很清楚啦, d ( 自 变 量 ) d(自变量) d()是自变量的微小变化的大小; d ( 因 变 量 ) d(因变量) d()是由于自变量的微小变化,引起因变量的微小变化的大小,其实知道这些就够啦,如果实在不明白的话,可以去看多元微积分(一)–导数与偏导数哦~,里面有详细的解释。
  话不多说,我们直接开始。

如何表示其他方向的导数呢?

一、怎样描述方向

  我们探究其他方向的导数,我们首先要知道这个方向用什么表示吧,也就是说要怎么去描述这个方向,总不能一直说类似x轴正方向偏y轴正方向45°的导数之类的方向吧(狗头)。
  一个简单实用的方法是使用向量,例如我们我们对上面所说的方向,便可以使用向量 ( 2 , 2 ) (2,2) (2,2)来进行描述.
多元微积分(二)--方向导数与梯度_第1张图片
  所以呢,我们以后就使用向量来代表方向啦。

二、方向导数

  什么是方向导数呢?突然拿出来这么一个名词,估计大家都有点儿懵了。我们在多元微积分(一)–导数与偏导数中讲到:沿着x方向的变化产生的导数称为x方向上的偏导数,沿着y方向的变化产生的导数称为y方向上的偏导数,那么沿着其余的方向的导数,例如沿着向量 ( a , b ) (a,b) (a,b)方向上的导数称为 ( a , b ) (a,b) (a,b)方向上的方向导数
  那么,方向导数该怎么求呢?根据我们上面提到的公式:
导 数 = l i m d ( 自 变 量 ) − > 0 d ( 因 变 量 ) d ( 自 变 量 ) 导数=lim_{d(自变量)->0}\frac{d(因变量)}{d(自变量)} =limd()>0d()d()
求一个导数,我们最起码需要知道d(自变量)和d(因变量),好啦,知道这个的话,最起码我们有一个大致方向啦!我们现在开始推导。

注意:我们以下的推导均假设方向为 ( a , b ) (a,b) (a,b),函数均假设为 z ( x , y ) z(x,y) z(x,y)

2.1 d(自变量)

  首先我们要取一个自变量的微小值,如下图所示:
多元微积分(二)--方向导数与梯度_第2张图片
我们取 ( a , b ) (a,b) (a,b)方向上的一个微小变化 d r dr dr,这个微小变化对应的x轴方向上的变化为 d x dx dx,y方向上的微小变化为 d y dy dy那么我们的 d ( 自 变 量 ) d(自变量) d()(自变量的微小变化大小)是什么呀?当然是 d r dr dr的长度啦,也就是
d ( 自 变 量 ) = ∣ d r ∣ = ( d x ) 2 + ( d y ) 2 d(自变量) = |dr| = \sqrt{(dx)^2 + (dy)^2} d()=dr=(dx)2+(dy)2
  这一小节讲完啦,简单吧~,下面我们就要来看 d ( 因 变 量 ) d(因变量) d()啦。

2.2 d(因变量)

  我们上面将 d ( 自 变 量 ) d(自变量) d()也就是 d r dr dr分解为 d x dx dx d y dy dy,这似乎给我们提供了求 d ( 因 变 量 ) d(因变量) d(),也就是 d z dz dz的一个思路:对x和y方向分别求出他们的自变量的变化,然后相加求和
  我们在以前的微积分课程中学习过,假设有一个函数 f ( x ) f(x) f(x),它的导函数是 f ′ ( x ) f'(x) f(x)那么我们在 x 0 x_0 x0附近有一个x的微小变化 d x dx dx,那么函数值的变化为 f ′ ( x 0 ) d x 0 f'(x_0)dx_0 f(x0)dx0。我们现在也一样,我们要求出因为 d r dr dr而产生的z的变化 d z dz dz也要用类似的原理。
  好啦,我们开始,先求x方向的变化,根据我们上篇文章讲的偏导数原理,x方向变化dx,引起的函数值z的变化 d z dz dz为:
d z x = ∂ z ∂ x × d x dz_x=\frac{\partial z}{\partial x} \times dx dzx=xz×dx
同理,由于y方向的变化dz,产生的z的变化为:
d z y = ∂ z ∂ y × d y dz_y=\frac{\partial z}{\partial y} \times dy dzy=yz×dy
所以引起的z的总变化就是:
d z = d z x + d z y = ∂ z ∂ x × d x + ∂ z ∂ y × d y dz = dz_x + dz_y = \frac{\partial z}{\partial x} \times dx + \frac{\partial z}{\partial y} \times dy dz=dzx+dzy=xz×dx+yz×dy
所以,我们的d(因变量)就是:
d ( 因 变 量 ) = ∂ z ∂ x × d x + ∂ z ∂ y × d y d(因变量) = \frac{\partial z}{\partial x} \times dx + \frac{\partial z}{\partial y} \times dy d()=xz×dx+yz×dy

2.3 求出方向导数

  根据以上的结果,我们结合公式:
导 数 = l i m d ( 自 变 量 ) − > 0 d ( 因 变 量 ) d ( 自 变 量 ) 导数=lim_{d(自变量)->0}\frac{d(因变量)}{d(自变量)} =limd()>0d()d()
我们代入得到:
导 数 = l i m d ( 自 变 量 ) − > 0 d ( 因 变 量 ) d ( 自 变 量 ) = l i m d r − > 0 d z d r = ∂ z ∂ x d x + ∂ z ∂ y d y ( d x ) 2 + ( d y ) 2 导数=lim_{d(自变量)->0}\frac{d(因变量)}{d(自变量)}=lim_{dr->0}\frac{dz}{dr} = \frac{\frac{\partial z}{\partial x}dx + \frac{\partial z}{\partial y}dy}{\sqrt{(dx)^2 + (dy)^2}} =limd()>0d()d()=limdr>0drdz=(dx)2+(dy)2 xzdx+yzdy
好家伙,这么复杂,这该怎么办嘞(擦汗)?
我们突然发现,沿着向量 ( a , b ) (a,b) (a,b),这个 d x dx dx d y dy dy是不是有关系啊,也就是dy是不是可以用dx表示出来呀!是嘞,突破口就在这里!
沿着向量 ( a , b ) (a,b) (a,b)我们有如下关系:
d y d x = b a \frac{dy}{dx} = \frac{b}{a} dxdy=ab
也就是
d y = b a d x dy = \frac{b}{a}dx dy=abdx
  好啦,问题解决啦。我们将dy带入到上面的导数关系式中得到:
∂ z ∂ x d x + ∂ z ∂ y d y ( d x ) 2 + ( d y ) 2 = ∂ z ∂ x d x + ∂ z ∂ y b a d x ( d x ) 2 + ( b a d x ) 2 = ∂ z ∂ x d x + ∂ z ∂ y b a d x 1 + ( b a ) 2 d x \frac{\frac{\partial z}{\partial x}dx + \frac{\partial z}{\partial y}dy}{\sqrt{(dx)^2 + (dy)^2}} = \frac{\frac{\partial z}{\partial x}dx + \frac{\partial z}{\partial y}\frac{b}{a}dx}{\sqrt{(dx)^2 + (\frac{b}{a}dx)^2}}=\frac{\frac{\partial z}{\partial x}dx + \frac{\partial z}{\partial y}\frac{b}{a}dx}{\sqrt{1+(\frac{b}{a})^2}dx} (dx)2+(dy)2 xzdx+yzdy=(dx)2+(abdx)2 xzdx+yzabdx=1+(ab)2 dxxzdx+yzabdx
啊哈!dx消掉啦!
∂ z ∂ x d x + ∂ z ∂ y b a d x 1 + ( b a ) 2 d x = ∂ z ∂ x + ∂ z ∂ y b a 1 + ( b a ) 2 \frac{\frac{\partial z}{\partial x}dx + \frac{\partial z}{\partial y}\frac{b}{a}dx}{\sqrt{1+(\frac{b}{a})^2}dx} = \frac{\frac{\partial z}{\partial x} + \frac{\partial z}{\partial y}\frac{b}{a}}{\sqrt{1+(\frac{b}{a})^2}} 1+(ab)2 dxxzdx+yzabdx=1+(ab)2 xz+yzab
我们再上下同乘以一个 a a a
∂ z ∂ x + ∂ z ∂ y b a 1 + ( b a ) 2 = ∂ z ∂ x a + ∂ z ∂ y b a 2 + b 2 \frac{\frac{\partial z}{\partial x} + \frac{\partial z}{\partial y}\frac{b}{a}}{\sqrt{1+(\frac{b}{a})^2}}=\frac{\frac{\partial z}{\partial x}a + \frac{\partial z}{\partial y}b}{\sqrt{a^2+b^2}} 1+(ab)2 xz+yzab=a2+b2 xza+yzb
  好家伙,怎么还是这么复杂!
  但是,我们现在使用 g \mathbf{g} g来表示一个新向量 ( ∂ z ∂ x , ∂ z ∂ x ) (\frac{\partial z}{\partial x}, \frac{\partial z}{\partial x}) (xz,xz)并令 m = ( a , b ) \mathbf{m}=(a,b) m=(a,b),那么我们发现这个答案可以表示为以下简洁的形式:
方 向 导 数 = ∂ z ∂ m = g ⋅ m ∣ m ∣ 方向导数 = \frac{\partial z}{\partial \mathbf{m}} = \frac{\mathbf{g} \cdot \mathbf{m}}{|\mathbf{m}|} =mz=mgm
  其中 ∂ z ∂ m \frac{\partial z}{\partial \mathbf{m}} mz表示函数 z ( x , y ) z(x,y) z(x,y) m = ( a , b ) \mathbf{m}=(a,b) m=(a,b)方向的方向导数。
  我们发现 m ∣ m ∣ \frac{\mathbf{m}}{|\mathbf{m}|} mm似乎表示 m \mathbf{m} m也就是 ( a , b ) (a,b) (a,b)方向的单位向量,我们将这个单位向量表示为 i \mathbf{i} i。那么我们可以表示为一个更简洁的形式:
方 向 导 数 = ∂ z ∂ m = g ⋅ i 方向导数 = \frac{\partial z}{\partial \mathbf{m}} = \mathbf{g} \cdot \mathbf{i} =mz=gi
其中 i \mathbf{i} i为方向上的单位向量。
  这就是我们最终方向向量的表示形式啦!

三、方向导数最大的方向(梯度)

  当我们求出来方向导数的公式的时候,我们有的人就会思考了:沿着什么方向方向导数最大呢?我们观察方向导数的公式:
∂ z ∂ m = g ⋅ i \frac{\partial z}{\partial \mathbf{m}} = \mathbf{g} \cdot \mathbf{i} mz=gi
对于两个向量的点乘,我们以前学习过以下公式:
a ⋅ b = ∣ a ∣ ∣ b ∣ c o s θ \mathbf{a} \cdot \mathbf{b} = |\mathbf{a}||\mathbf{b}|cos\theta ab=abcosθ
其中 θ \theta θ为向量 a \mathbf{a} a b \mathbf{b} b的夹角。
那么我们的方向导数公式可以怎么表示呢?很简单啦!
∂ z ∂ m = g ⋅ i = ∣ g ∣ ∣ i ∣ c o s θ \frac{\partial z}{\partial \mathbf{m}} = \mathbf{g} \cdot \mathbf{i}=|\mathbf{g}||\mathbf{i}|cos\theta mz=gi=gicosθ
因为向量 i \mathbf{i} i为单位向量,那么其模为 1 1 1,所以有:
∣ g ∣ ∣ i ∣ c o s θ = ∣ g ∣ c o s θ |\mathbf{g}||\mathbf{i}|cos\theta = |\mathbf{g}|cos\theta gicosθ=gcosθ
所以当然是当 c o s θ = 1 cos\theta = 1 cosθ=1的时候,方向导数的值最大呀!那么,啥时候 c o s θ = 1 cos\theta = 1 cosθ=1呢?当然是向量 g \mathbf{g} g和向量 i \mathbf{i} i一个方向的时候呀,因为 i \mathbf{i} i是向量 m \mathbf{m} m方向上的单位向量,所以也就是向量 g \mathbf{g} g和向量 m \mathbf{m} m一个方向。
向量 g \mathbf{g} g是什么方向呢?我们上文中说啦,向量 g = ( ∂ z ∂ x , ∂ z ∂ x ) \mathbf{g}=(\frac{\partial z}{\partial x}, \frac{\partial z}{\partial x}) g=(xz,xz),所以当然是沿着 ( ∂ z ∂ x , ∂ z ∂ x ) (\frac{\partial z}{\partial x}, \frac{\partial z}{\partial x}) (xz,xz)方向的方向导数最大呀。那么我们这个向量 g \mathbf{g} g就不一般了,因为它的方向上方向导数的值最大。所以我们给这个向量一个特殊的名字:梯度,这个向量是函数 z ( x , y ) z(x,y) z(x,y)在一个点的梯度。是不是感觉梯度是什么一下子明白了呢?
  好啦,我们这一节讲完啦!下一节我们会讲链式法则,不过我请大家牢记我们这一节推导方向导数时用到的思想:将自变量的微小变化分解为x方向的微小变化dx和y方向的微小变化dy,然后对x和y方向分别求出他们的因变量的变化,然后相加求和。因为我们分析链式法则时仍然会用到这个思想。
  下节见~

你可能感兴趣的:(高等数学,概率论,线性代数,几何学)