Hinton Neural Networks课程笔记1e: 监督学习、强化学习、无监督学习,及其应用
这节课介绍了机器学习的几大框架,分别是监督学习(supervisedlearning)、强化学习(reinforcementlearning)和无监督学习(unsupervisedlearning)。都是十分古老、传统、广泛应用的框架。监督学习监督学习是根据输入预测输出,即学习一个y=f(x;W)。这里面的W是f参数的显示表示,输入是x,输出是y。学习过程就是给很多(x,y)对,然后学习W使得f(