深度学习-局部最小值

梯度为0

一直以为梯度为0的情况是到达了local minima,看了视频,才了解到,梯度为0,并不一定是local minima,也有可能是saddle point(鞍点)。

如何区分local minima和saddle point?

L(θ)≈L(θ′)+(θ−θ′)Tg+1/2(θ−θ′)TH(θ−θ′)

1.所有 v 都使得 vTHv>0,则L(θ)>L(θ′),这个临界点就是local minima。

2.所有 v 都使得 vTHv<0,则L(θ)

3.有部分v使 vTHv<0,有部分点使vTHv>0,则这个临界点是saddle point。

你可能感兴趣的:(深度学习-局部最小值)