动手学习深度学习-《矩阵运算》

标量导数

常用求导:

y y y a a a x n x^n xn e x p ( x ) exp(x) exp(x) l o g ( x ) log(x) log(x) s i n ( x ) sin(x) sin(x)
d y d x \frac{dy}{dx} dxdy 0 0 0 n x n − 1 nx^{n-1} nxn1 exp(x) 1 x \frac{1}{x} x1 c o s ( x ) cos(x) cos(x)

求导公式:

y y y u + v u+v u+v u v uv uv y = f ( u ) , u = g ( x ) y=f(u),u=g(x) y=f(u),u=g(x)
d y d x \frac{dy}{dx} dxdy d u d x + d v d x \frac{du}{dx}+\frac{dv}{dx} dxdu+dxdv d u d x v + d v d x u \frac{du}{dx}v+\frac{dv}{dx}u dxduv+dxdvu d y d u d u d x \frac{dy}{du}\frac{du}{dx} dudydxdu

亚导数

将导数扩展到不可微的函数
例如: y = ∣ x ∣ y=|x| y=x
x = 0 x=0 x=0时,导数不存在;如下图所示:
动手学习深度学习-《矩阵运算》_第1张图片
解决办法,在导数不存在的地方人为设定一个值:

动手学习深度学习-《矩阵运算》_第2张图片


梯度

将导数扩展到向量:梯度指向的是值变化最大的方向

标量对向量求导:
y y y是标量, x \bf{x} x是列向量。下面公式采用分子布局:

y y y a a a a u au au s u m ( x ) sum(x) sum(x) ∣ ∣ x ∣ ∣ 2 ||x||^2 ∣∣x2
∂ y ∂ x \frac{∂y}{∂\bf{x}} xy 0 T 0^T 0T a ∂ u ∂ x a\frac{∂u}{∂\bf{x}} axu 1 T 1^T 1T 2 x T 2\bf{x}^T 2xT

动手学习深度学习-《矩阵运算》_第3张图片

求导公式:

y y y u + v u+v u+v u v uv uv < u , v > <\bf{u},\bf{v}> <u,v>
∂ y ∂ x \frac{∂y}{∂\bf{x}} xy ∂ u ∂ x + ∂ v ∂ x \frac{∂u}{∂\bf{x}}+\frac{∂v}{∂\bf{x}} xu+xv ∂ u ∂ x v + ∂ v ∂ x u \frac{∂u}{∂\bf{x}}v+\frac{∂v}{∂\bf{x}}u xuv+xvu u T ∂ y ∂ x + v T ∂ u ∂ x \bf{u^T}\frac{∂y}{∂\bf{x}}+\bf{v^T}\frac{∂u}{∂\bf{x}} uTx∂y+vTx∂u

u , v u,v u,v表示与 x \bf{x} x相关的表达式,是个标量
< u , v > <\bf{u},\bf{v}> <u,v>:表示向量内积


向量对标量求导
分子布局:
动手学习深度学习-《矩阵运算》_第4张图片


向量对向量求导
动手学习深度学习-《矩阵运算》_第5张图片


扩展到矩阵
动手学习深度学习-《矩阵运算》_第6张图片

你可能感兴趣的:(动手学习深度学习-李沐老师,学习,深度学习,矩阵)