机器学习 (笔记)牛顿方法

大纲:

1.牛顿方法

2.指数簇

3:广义线性模型(GLM)

1.牛顿方法

假设有函数:,我们希望找到满足这里写图片描述这里写图片描述值. 这里这里写图片描述是实数.

牛顿方法的过程:

1:先初始化这里写图片描述值,记为

2:找到对应点(这里写图片描述),在此点求切线,

3:找到切线与x轴交点,作为,继续执行步骤2

4:直到找到这里写图片描述这里写图片描述值,这里的这里写图片描述值很大程度上是无限接近于,结合图看。

机器学习 (笔记)牛顿方法_第1张图片

  推理过程:

 记,根据导数定义有:,整理有:,以此类推,有

,则可以得出一般规律:,令,我们可以用同样的算法去最大化这里写图片描述同理可以得到牛顿方法更新参数的一般规律:


牛顿方法的一般化:
如果这里写图片描述是一个向量,那么:
这里写图片描述
其中,这里写图片描述这里写图片描述这里写图片描述的偏导数;
H称为海塞矩阵(Hessian matrix),是一个n*n的矩阵,n是特征量的个数,并且这里写图片描述

牛顿方法比批处理梯度下降,梯度上升,梯度下降等的收敛速度快很多,很少次的迭代(十几次)就能够非常接近最小值了;但是因为每次迭代都要求海塞矩阵的值,当n很大时,求海塞矩阵的逆代价是很大的.

注:如果用牛顿方法求最小值的话,公式也不会改变


2.指数分布簇

机器学习 (笔记)牛顿方法_第2张图片

机器学习 (笔记)牛顿方法_第3张图片


机器学习 (笔记)牛顿方法_第4张图片

机器学习 (笔记)牛顿方法_第5张图片

机器学习 (笔记)牛顿方法_第6张图片

机器学习 (笔记)牛顿方法_第7张图片

机器学习 (笔记)牛顿方法_第8张图片

 

 

 

       以上均是自己所见,如果有错的地方欢迎指出哦




你可能感兴趣的:(机器学习,斯坦福,牛顿方法)