偏导数,雅可比矩阵(jacobi matrix),黑塞矩阵(Hessian matrix)

这里我们大致地复习一下偏导数,雅克比矩阵以及黑塞矩阵的定义和关系。

导数向量与雅克比矩阵(Jacobi matrix)

函数的某个因变量对某个自变量求的导数即为它们关于函数的偏导数。当因变量为一元的情况下,各个自变量的偏导数组成了导数向量.当函数因变量为多元的情况下,函数的导数可由jacobi matrix来描述。E.g., 现有一函数可将m维的自变量映射到n维的因变量上,也就是说该函数由n个子函数构成 y 1 ( x 1 , . . . , x m ) , . . . , y n ( x 1 , . . . , x m ) y_1(x_1,...,x_m),...,y_n(x_1,...,x_m) y1(x1,...,xm),...,yn(x1,...,xm).而jacobi matrix则由这些自变量和因变量之间的偏导数组成,构成一个n行m列的矩阵:
[ ∂ y 1 ∂ x 1 ⋯ ∂ y 1 ∂ x m ⋮ ⋱ ⋮ ∂ y n ∂ x 1 ⋯ ∂ y n ∂ x m ] (3) \left[ \begin{matrix} \frac{\partial y_1}{\partial x_1} & \cdots & \frac{\partial y_1}{\partial x_m} \\ \vdots & \ddots & \vdots \\ \frac{\partial y_n}{\partial x_1} & \cdots & \frac{\partial y_n}{\partial x_m} \end{matrix} \right] \tag{3} x1y1x1ynxmy1xmyn(3)
这个Jacobi matrix可以写作 J F ( x 1 , . . . , x m ) J_F(x_1,...,x_m) JF(x1,...,xm),或者是 ∂ ( y 1 , . . . , y n ) ∂ ( x 1 , . . . , x m ) \frac{\partial (y_1,...,y_n)}{\partial (x_1,...,x_m)} (x1,...,xm)(y1,...,yn)

黑塞矩阵(Hessian matrix)

一句话来讲,Hessian matrix是多元函数(单因变量)的二阶偏导数组成的方阵,它也可以被理解为该函数的一阶导数向量的Jacobi matrix!当函数满足:
y = f ( x 1 , . . . , x m ) y = f(x_1,...,x_m) y=f(x1,...,xm)该函数存在一阶偏导数向量:
[ ∂ y ∂ x 1 , . . . ∂ y ∂ x m ] [\frac{\partial y}{\partial x_1},...\frac{\partial y}{\partial x_m}] [x1y,...xmy].若该函数存在二阶导数,则其Hessian matrix H ( f ) H(f) H(f)为:
[ ∂ 2 y ∂ x 1 2 ⋯ ∂ 2 y ∂ x 1 ∂ x m ⋮ ⋱ ⋮ ∂ 2 y ∂ x m ∂ x 1 ⋯ ∂ 2 y ∂ x m 2 ] (3) \left[ \begin{matrix} \frac{\partial^2 y}{\partial x_1^2} & \cdots & \frac{\partial^2 y}{\partial x_1 \partial x_m} \\ \vdots & \ddots & \vdots \\ \frac{\partial^2 y}{\partial x_m \partial x_1} & \cdots & \frac{\partial^2 y}{\partial x_m^2} \end{matrix} \right] \tag{3} x122yxmx12yx1xm2yxm22y(3)

你可能感兴趣的:(ML中的数学)