基于LSTM网络的视觉识别研究与实现——详细版

1.问题描述:

        随着计算机技术的快速发展,视觉识别技术在越来越多的领域得到应用,视觉识别系统的准确性以及实时性直接对整个系统的性能有着深远的影响。视觉识别系统涉及到包括计算机科学,图像处理技术,神经网络技术,模式识别技术,信号处理与分析技术以及认知学等多种科学技术。从理论上介绍了深度学习神经网络的基本原理,主要包括基于受限玻尔兹曼机(Restricted Boltzmann Machine,RBM)结构的深度学习神经网络和基于小波运算结构的深度学习神经网络;然后介绍了递归神经网络(Recurrent Neural Network,RNN)神经网络,针对其缺陷,从而提出了基于长短期记忆单元(Long Short Term Memory,LSTM)网络的基本原理。以人脸图像的视觉识别为研究对象,研究了基于LSTM长短期记忆单元网络的视觉识别算法,通过使用卷积神经网络学习人脸图像的特征信息,然后使用LSTM网络建立序列知识,并生成描述性的句子,作为特征序列,建立一种基于句子描述的LSTM网络的视觉识别算法,最后通过MATLAB对该算法进行了仿真验证,对于不同姿态,不同干扰因素影响下的目标图像,本文所提出的基于LSTM的视觉识别正确率可以达到76%以上。

你可能感兴趣的:(★MATLAB算法仿真经验,LSTM,视觉识别,深度学习,神经网络)