多层自编码器的结构如图1所示,它包含一个具有2个隐藏层的栈式自编码器和1个softmax模型;栈式自编码器的最后一个隐藏层的输出作为softmax模型的输入,softmax模型的输出作为整个网络的输出(输出的是条件概率向量)。
图1 多层自编码器的结构
微调多层自编码器的流程图如图2所示,该流程主要包括三部分:
(1)初始化待优化参数向量
(2)调用最优化函数,计算最优化参数向量
(3)得到最优化参数向量,可以转换为网络各结构所对应的参数
其中,最小化代价函数主要利用minFunc函数,该优化函数格式如下:
可知,为了实现优化过程,最为关键问题就是编写stackedAECost函数
图2 多层自编码器的微调流程
整个网络的参数stackedAETheta(列向量形式)由两部分组成:softmax分类器参数向量+稀疏自编码器参数向量;他们的初始化值由稀疏自编码和softmax学习获得:
多层网络的稀疏自编码器部分如下图所示
图3 多层网络的稀疏自编码器部分
该多层网络的代价函数完全按照softmax模型的代价函数计算,并加入正则项,但要注意,这里加入的正则项必须要对整个网络的所有参数进行惩罚!
该模型的梯度计算与单独使用softmxa模型的公式是相同的,即:
只不过这里的x为softmax自编码器最后一层的输出h(2)。
最后,将整个网络的梯度(softmaxThetaGrad和stackgrad)存放在一个列向量中