基于LSTM网络的视觉识别

1.问题描述:

       以人脸图像的视觉识别为研究对象,研究了基于LSTM长短期记忆单元网络的视觉识别算法,通过使用卷积神经网络学习人脸图像的特征信息,然后使用LSTM网络建立序列知识,并生成描述性的句子,作为特征序列,建立一种基于句子描述的LSTM网络的视觉识别算法,最后通过MATLAB对该算法进行了仿真验证,对于不同姿态,不同干扰因素影响下的目标图像,基于LSTM的视觉识别正确率可以达到76%以上。

    长短时记忆模型LSTM是由Hochreiter[24]等人在1997年首次提出的,其主要原理是通过一种特殊的神经元结构用来长时间存储信息。LSTM网络模型的基本结构如下图所示:

基于LSTM网络的视觉识别_第1张图片

图 LSTM网络的基本结构

    从图2.7的结构图可知,LSMT网络结构包括输入层,记忆模块以及输出层三个部分,其中记忆模块由输入门(Input Gate)、遗忘门(Forget Gate)以及输出门(Output Gate)。LSTM模型通过这三

你可能感兴趣的:(★MATLAB算法仿真经验,LSTM,人脸识别,深度学习,机器学习)