【机器学习】多元函数梯度的理解

一元函数的导数

导数的几何意义是很明确的,一个函数上某点的导数可以表示为该点在函数曲线上的切线斜率。或者从极限的角度来看,导数表示该点在函数上的变化率:
f ′ ( x 0 ) = l i m Δ x → 0 f ( x 0 + Δ x ) − f ( x 0 ) Δ x f'(x_{0}) = \mathop{lim} \limits_{\Delta x \to 0} \frac{f(x_{0}+\Delta x) - f(x_{0})}{\Delta x} f(x0)=Δx0limΔxf(x0+Δx)f(x0)即对于函数上的某一点,当该点的变化趋于0时,函数值的变化与自变量变化的比值代表了导数。

多元函数的偏导

对于多元函数,我们所说的偏导数指的就是多元函数沿着坐标轴方向的变化率。例如对于二元函数 z = f ( x , y ) z = f(x, y) z=f(x,y)来说, f x ( x , y ) f_{x}(x, y) fx(x,y)指的是函数在 y y y方向不变,函数沿着 x x x方向的变化率。

对于空间中的一点 ( x 0 , y 0 ) (x_{0}, y_{0}) (x0,y0)处的偏导数的几何意义是: f x ( x 0 , y 0 ) f_{x}(x_{0}, y_{0}) fx(x0,y0)表示曲面函数 z = f ( x , y ) z = f(x, y) z=f(x,y)被平行于 x O z xOz xOz平面的 y = y 0 y = y_{0} y=y0平面所截得的曲线,在点 ( x 0 , y 0 ) (x_{0}, y_{0}) (x0,y0)处沿着 x x x轴方向的斜率。

多元函数的梯度

由于偏导数只能表示多元函数沿着坐标轴的变化率,但是在实际很多情况中,我们需要得到多元函数沿着任意方向的变化率,所以就引入了方向导数。因此,方向导数的作用就是用于计算多元函数任意方向的变化率。

在多维空间中,梯度是一个向量,表示某个函数在该点处的方向导数沿着该方向取得最大值,也即是,函数沿着梯度方向的变化速度是最快的

因此,梯度的方向是方向导数中取到最大值的方向,梯度的值是方向导数的最大值。

对于多元函数而言,每个变量只要沿着这个变量的偏导的方向变化,函数的整体变化就可以达到最大,因此多元函数的梯度可以表示为: g r a d   F ( x 0 , y 0 , z 0 ) = ( F x ( x 0 , y 0 , z 0 ) , F y ( x 0 , y 0 , z 0 ) , F z ( x 0 , y 0 , z 0 ) ) grad \ F(x_{0}, y_{0}, z_{0}) = (F_{x}(x_{0}, y_{0}, z_{0}), F_{y}(x_{0}, y_{0}, z_{0}), F_{z}(x_{0}, y_{0}, z_{0})) grad F(x0,y0,z0)=(Fx(x0,y0,z0),Fy(x0,y0,z0),Fz(x0,y0,z0))

参考资料

如何直观形象的理解方向导数与梯度以及它们之间的关系? - 忆臻的回答 - 知乎

多元函数的偏导数、方向导数、梯度以及微分之间的关系思考

你可能感兴趣的:(math,算法)