文献阅读:卷积神经网络在图像识别中的应用研究综述

图像识别是区分不同类别的图像,卷积神经网络 (CNN) 是完成图像识别任务的最佳算法之一,设计卷积神经网络的目的就是模仿人类的学习模式,通过对输入样本的训练与测试,由简到深地提取特征来区分样本。

本文重点综述了卷积神经网络相关算法在人脸识别、人体动作识别、医疗图像处理和农业病虫害识别方面的应用及其优缺点。后面会对其进行介绍。

卷积神经网络概述:

卷积神经网络是一种前馈多层网络,信息的流动只有一个方向,即从输入到输出,每个层使用一组卷积核执行多个转换。CNN 模型主要包含卷积层、池化层、全连接层。以 CNN 模型为基础,将多层卷积和多层池化结合产生新的网络模型,可提高网络结构的准确度。

与其他神经网络的不同之处在于,CNN 中存在一层或多层中的矩阵乘法运算被替换成卷积运算,其利用多层神经网络和图像局部性的优点减少了大量参数,提高模型训练速度。

CNN 的基本结构为特征提取层和特征映射层。特征映射结构主要是使用 Sigmoid 函数对卷积神经网络进行操作,保证其位移不变性。卷积层是 CNN 中最基本的也是最重要的一层,基本上是对给定图像的像素矩阵进行卷积或乘法,以生成给定图像的激活映射( activation map)

文献阅读:卷积神经网络在图像识别中的应用研究综述_第1张图片 卷积神经网络 LeNet-5 模型结构图

 在图像识别中的应用研究:

1、人脸识别:

人脸识别( F) 技术利用计算机学习通过人脸特征来提取个人信息。人脸检测自动检测人眼、鼻子等部位的轮廓点等人脸特征点,从而实现人脸关键点的高精度识别和定位。

人脸识别大多采用视频进行检测,由于人脸的表情、姿态、年龄、位置等引起的类内变化以及外界光照、背景等身份不同引起的类间变化从而影响视频检测人脸的精度,因此基于视频的人脸识别仍然是一个重大的挑战。为了提高人脸识别率,需要增强人脸特征对这些因素的鲁棒性。

人脸识别是一种流行而有效的生物识别认证形式,可用于访问基于用户的系统。但是人脸识别技术的一个缺点就是伪装者可以通过向传感器展示有效的用户照片来访问系统, 使得人脸识别系统面临着各种类型的人脸欺骗攻击。

2、人体动作识别:

视频中人体动作识别就是在视频内容和行为类型之间建立对应关系。传统的人体动作识别方法分为基于人体运动信息的特征提取方法和基于时空兴趣点的特征提取方法两大类。特征提取过程划分为特征提取与后续动作识别两个阶段。深度学习端到端的训练方法可以对特征提取与后续的分类识别进行统一训练与学习。

近年来,人体动作识别取得了相当大的进展,但是由于遮挡、摄像机移动、光照变化、背景的复杂多样、受试者动作类似等原因,要准确地识别视频序列中的动作仍然具有挑战性。

3、医疗图像处理:

医学图像种类繁多、分辨率低、人体结构复杂,在一定程度上限制了医生对患者做出有效诊断。当前临床影像诊断主要是人工阅片,但效率低下,且肉眼阅片方法存在较高的假阳性结果。卷积神经网络模型是医学影像中预测早起疾病症状的重要方式,通过有监督与无监督的算法对一些特定标准的数据集进行预测。下图是深度学习在医疗图像中的部分研究应用。

文献阅读:卷积神经网络在图像识别中的应用研究综述_第2张图片 深度学习在医疗图像中的部分研究应用

 4、农业病虫害识别:

病虫害是农业领域面临的最大的挑战,传统病虫害检测方法依靠农民的经验或者专家指导。由于农作物类型复杂、生长阶段不均等因素导致农作物图像特征提取困难,检测率低下。随着卷积神经网络的发展,目前科研工作者已经将其广泛运用于病虫害识别检测、植物和农作物的识别、杂草的检测与分类等多项研究。

由于实际农田中摄像机的稀疏性,所获取的图像往往模糊不清,且现有技术主要基于清晰、高分辨率的图像数据集上训练的,对于低分辨率图像的识别效果不佳。农作物病虫害种类多,每种病虫害对应的数据集比较少,因为需要为每种病虫害建立一定数量、一定规模的病虫害图像数据集。

总结与展望:

卷积神经网络在计算机视觉方面的应用,包括图像的分类识别、视频识别等都有着明显的优势,在语音识别方面也取得了突破性的进展,但是图像识别在实际运用中仍然存在一些挑战,值得研究者进一步探讨研究与解决。

①模糊图像、受环境影响的图像( 如受光线、噪声影响) 、遮挡的图像等情况

大规模数据量的涌现,无标签的未知数据占绝大多数,学会从无标注的数据里面进行学习

非欧空间数据不存在平移不变性,采用图卷积神经网络可以处理图数据

如何在少量样本情况下即保证识别精度又能大大提高网络的训练速度

论文来源:中国知网,作者盖荣丽

你可能感兴趣的:(组会汇报,cnn,深度学习,机器学习)