导数、偏导数、方向导数、梯度、梯度下降

导数

设有一元函数

则函数在点 处的导数为

求出来的值是 在 处沿 方向的变化率即

也是 在 处的切线的斜率

如果函数有极小值,那么使 不断沿着切线方向减少,可以得到使 最小的
即通过下面的迭代,算出来的 可以使 最小

其中 是步长,即沿切线方向变化的大小,必须取一个很小的值

偏导数

设有多元函数


则函数在点 处沿 方向的偏导数为



求出来的值是 在 处沿 方向的变化率即



也是 在 处沿 方向的切线的斜率(函数在 处有不同方向的多条切线)
计算过程是只把一个坐标轴当成变量,其他轴当成常量,这样变成对一元函数求导
其实偏导就是对多元函数的某个二维切面求导

举个简单的例子


该函数是一个以坐标原点为顶点的旋转抛物面

导数、偏导数、方向导数、梯度、梯度下降_第1张图片

求在 方向的偏导,就是把 当常数然后求导,结果为


实际上固定 得到的是一个二维切面,这个切面实际上是一条抛物线
该抛物线形状不受 取值的影响, 的变化影响的是抛物线的位置
就像 在 处的导数即切线斜率不受 值的影响

可以看到导数和偏导数本质上是一样的,都是求函数值沿某个坐标轴方向的变化率
只不过导数针对一元函数,偏导数针对多元函数

方向导数

偏导数只能求函数值在某个坐标轴方向的变化率,方向导数则是求函数值在任意方向的变化率

设有多元函数


则函数在点 处沿任意方向 的导数为



其中


  的方向由 各个值的比例关系决定

可以看到偏导数是方向导数的一个特例,即 只在一个方向上有值的话就是偏导数

将 转换为余弦向量,可以通过偏导数求出方向导数
比如

要求导的点为

要求导的方向为

的长度为

转为余弦向量

则有

   
   
   

梯度

方向导数是为了求函数值在某个点沿某个方向的变化率
梯度则是为了求函数值在某个点处变化率最大的方向,梯度由各个轴的偏导函数组成

设有多元函数

其在 处的梯度为

可以看到梯度是一个向量,代表函数值变化率最大的方向

并且该梯度向量在每个轴的分量是函数在该轴的偏导数


梯度下降

如果函数有极小值,那么使 不断沿着梯度方向减小,可以得到使 最小的
即通过下面的迭代,算出来的 可以使 最小
  
其中 是步长,即沿梯度方向变化的大小,必须取一个很小的值




你可能感兴趣的:(导数、偏导数、方向导数、梯度、梯度下降)