黑塞矩阵(海森矩阵,Hessian Matrix)与牛顿法最优化

黑塞矩阵

                         黑塞矩阵(Hessian Matrix),又译作海森矩阵、海瑟矩阵、海塞矩阵等,是一个多元函数的二阶偏导数构成的方阵,描述了函数的局部曲率。黑塞矩阵最早于19世纪由德国数学家Ludwig Otto Hesse提出,并以其名字命名。黑塞矩阵常用于牛顿法解决优化问题,利用黑塞矩阵可判定多元函数的极值问题。在工程实际问题的优化设计中,所列的目标函数往往很复杂,为了使问题简化,常常将目标函数在某点邻域展开成泰勒多项式来逼近原函数,此时函数在某点泰勒展开式的矩阵形式中会涉及到黑塞矩阵。

                         在数学中, 海森矩阵(Hessian matrix或Hessian)是一个自变量为向量的实值函数的二阶偏导数组成的方块矩阵, 此函数如下:

f(x1,x2,xn) f ( x 1 , x 2 … , x n )

如果 f f 的所有二阶导数都存在, 那么 f f 的海森矩阵即:
H(f)ij(x)=DiDjf(x)=2fx212fx2x12fxnx12fx1x22fx222fxnx22fx1xn2fx2xn2fx2n(1) H ( f ) i j ( x ) = D i D j f ( x ) = [ ∂ 2 f ∂ x 1 2 ∂ 2 f ∂ x 1 ∂ x 2 ⋯ ∂ 2 f ∂ x 1 ∂ x n ∂ 2 f ∂ x 2 ∂ x 1 ∂ 2 f ∂ x 2 2 ⋯ ∂ 2 f ∂ x 2 ∂ x n ⋮ ⋮ ⋱ ⋮ ∂ 2 f ∂ x n ∂ x 1 ∂ 2 f ∂ x n ∂ x 2 ⋯ ∂ 2 f ∂ x n 2 ] ( 1 )

其中 x=(x1,x2,xn) x = ( x 1 , x 2 … , x n )

                         将二元函数的泰勒展开式推广到多元函数,则 f(x1,x2,...,xn) f ( x 1 , x 2 , . . . , x n ) X(0) X ( 0 ) 点处的泰勒展开的矩阵形式为:

f(X)=f(X(0))+f(X(0))TX+12XTG(X(0))X+... f ( X ) = f ( X ( 0 ) ) + ∇ f ( X ( 0 ) ) T ∇ X + 1 2 ∇ X T G ( X ( 0 ) ) ∇ X + . . .

其中:
(1) f(X(0))=[fx1,fx2,fxn]|TX(0) ∇ f ( X ( 0 ) ) = [ ∂ f ∂ x 1 , ∂ f ∂ x 2 , ∂ f ∂ x n ] | X ( 0 ) T ,它是 f(X) f ( X ) X(0) X ( 0 ) 点处的梯度。
(2) G(X(0)) G ( X ( 0 ) ) 就是上面的式子(1),为函数 f(X) f ( X ) X(0) X ( 0 ) 点处的黑塞矩阵。
黑塞矩阵是由目标函数 f f 在点X处的二阶偏导数组成的 nn n ∗ n 阶对称矩阵。

Hessian矩阵判断
(1)如果是正定矩阵,则临界点处是一个局部极小值
(2)如果是负定矩阵,则临界点处是一个局部极大值
(3)如果是不定矩阵,则临界点处不是极值

实二次型矩阵为正定二次型的判断方法
判断一个矩阵是否是正定方法
1、顺序主子式:实对称矩阵为正定矩阵的充要条件是的各顺序主子式都大于零。
2、特征值:矩阵的特征值全大于零,矩阵为正定。矩阵的特征值全小于零,矩阵为负定。否则是不定的。

这里写图片描述

牛顿法参考如下:

Jacobian矩阵和Hessian阵 — 讲解hessian及其求解应用

Hessian应用

Hessian矩阵以及在图像中的应用
图像处理之Hessian矩阵提取关键点

你可能感兴趣的:(算法基础,数学,黑塞矩阵,海森矩阵,hessian,matrix)