1、这是一个两层的神经网络,也可以叫做的模型;
2、这里面包含四个输入_(1 ),_2,_3,_4,对应于英文的nlp模型可以理解为每个单词或词组;
3、Hidden unit层的圆圈代表感知机,一个感知机相当于大脑的一个神经细胞;
4、最后的输出y,对应于分类的模型就是分类的类别。
训练过程中
输入的单词在进入感知机后,如果输出预测类别和真实的类别有差距,模型会对感知机内部的参数进行调整,使得预测的和真实值不断接近。 因为模型每次调整不会一部到位,而是调整小量的值(预防调整过头)。所以我们需要一定量带有真实类别y数据和时间来训练模型。 现实生活中进行的分类一般不只一类,一句话也不只4个单词。对应这样的工程就需要大量的数据集来训练模型。
要达到高性能水平,必须考虑两件事:
1、能够训练足够大的神经网络 ;
2、大量标记数据。