CS224n 深度自然语言处理(四) Note - Backpropagation and computation graphs
本文为笔者学习CS224N所做笔记,所包含内容不限于课程课件和讲义,还包括笔者对机器学习、神经网络的一些理解。所写内容难免有难以理解的地方,甚至可能有错误。如您在阅读中有疑惑或者建议,还望留言指正。笔者不胜感激!在本章中,将着重讨论以下内容:如何更新神经网络参数?以何种形式保存更新结构?搭建和训练神经网络的技巧.梯度和导数上一章提到,应该最小化损失函数。损失函数的参数是神经网络参数,由于梯度的方向