通俗理解深度学习中的知识

  • 如何理解反向传播算法
  • 一文弄懂神经网络中的反向传播法——BackPropagation
  • 神经网络输出层为什么通常使用softmax?(为什么神经网络分类器要用交叉熵损失函数)

关于语言模型的论文

  • BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding

你可能感兴趣的:(深度学习,深度学习,人工智能)