专栏介绍:本栏目为 “2022春季中国科学院大学王亮老师的深度学习” 课程记录,这门课程与自然语言处理以及机器学习有部分知识点重合,重合的部分不再单独开博客记录了,有需要的读者可以移步 自然语言处理专栏和机器学习专栏。 如果感兴趣的话,就和我一起入门DL吧
什么是梯度消失和梯度爆炸?
在误差反向传播过程中,需要对损失函数求导,损失函数描述了标准答案与实际输出的误差,在DNN中,输出是要经过一个激活函数的。这就意味着,损失函数的倒数一定与激活函数的导数有关联关系。
补充:解决梯度消失问题的办法: