2019年伯克利大学 CS294-112《深度强化学习》第3讲:TensorFlow 和神经网络简述(笔记)
今天课的主要内容是TensorFlow的教程和深度神经网络,由助教GregKahn主讲。在开始之前,想继续讲一下上周的一些讨论,因为上次最后没有讲完的所有理论,这是上星期的课程的一点尾巴。在很多场景下,模仿学习是一个学习策略的合适方法,但是在另外一些场景,模仿学习就力不从心了,这也是课程要讲强化学习的理由。如果你想超越模仿学习,非常重要的是确切的定义出一个决定是好是坏,而不是仅仅说采取的行动符合在