【跟李沐学AI—动手学深度学习 pytorch版】学习笔记

第12节 权重衰减(待完善)

下式为带正则项的优化函数,正则项会牵引着参数w尽量往零点移动。
带正则项的优化函数对上式计算梯度可得
【跟李沐学AI—动手学深度学习 pytorch版】学习笔记_第1张图片梯度更新为
在这里插入图片描述 η λ \eta\lambda ηλ一般小于1,在深度学习中通常叫做权重衰减。

你可能感兴趣的:(pytorch,深度学习,人工智能)