基于AlexNet卷积神经网络的手写体数字倾斜校正系统研究-附Matlab代码

⭕⭕ 目 录 ⭕⭕

  • ✳️ 一、引言
  • ✳️ 二、AlexNet 网络
  • ✳️ 三、实验验证
    • ✳️ 3.1 实验数据集
    • ✳️ 3.2 数据训练
    • ✳️ 3.3 手写体倾斜数字校正结果
  • ✳️ 四、参考文献
  • ✳️ 五、Matlab代码获取

✳️ 一、引言

手写体数字识别是光学字符识别(Optical CharacterRecognition,OCR)的一个分支,是利用计算机将图片中的文字信息转换为计算机语言的过程。数字识别是一种图像分类问题,一直是机器深度学习的一个热点研究问题,在快递单号、财务报表、手写票据等领域广泛应用。数字识别的重点在于算法对图像本身的特征提取,传统的分类算法都存在特征提取不充分的问题,如贝叶斯分类法、K最近邻算法、支持向量机(SupportVectorMachines,SVM)、BP(BackPropagation)神经网络等。

卷积神经网络(ConvolutionalNeuralNetwork,CNN)的出现,极大地提高了手写数字识别的准确率。CNN是由美国学者Cun提出的一种深度前馈人工神经网络,包括卷积层、池化层、全连接层和输出层。CNN通过对提取到的图像特征自动学习,能够获得更高层次的特征表达,使学习到的特征信息具有更好的泛化能力。邓长银等通过改变LeNet-5模型的网络层数、激活函数以及输入图片的尺寸,相较传统方法识别率有所提高。茹晓青等提出了一种基于形变卷积神经网络的识别方法,利用形变卷积代替VGG16模型中的普通卷积,提高了多变外观数字的识别精度。陈玄等提出了一种融合卷积神经网络,通过融合两种网络的高级特征,增加网络层的高级尺寸,增强网络的表达能力,识别的精度高于两种模型单独使用。

✳️ 二、AlexNet 网络

AlexNet 是由多伦多大学的 Krizhevsky 等在2012 年提出的, 并在当年的 ImageNet 大赛上打破了图像分类的记录获得了比赛的冠军, 使图像分类的准确率提高了一倍多。

AlexNet 的网络结构如图 1 所示, AlexNet 网络模型结构简洁, 由 5 层卷积层、2 层隐藏全连接层和一层输出全连接层组成。整个网络结构使用ReLu 代替 Sigmoid 作为激活函数, 能有效地解决Sigmoid 在层数较多的网络结构中出现的梯度弥散问题。同时网络在全连接层后添加 Dropout 操作,利用随机隐退神经元个数的方法, 在网络的训练过程中减少模型的参数量, 能够有效地防止过拟合现象的出现。在Relu激活函数后添加局部响应归一化( Local Response Norm, LRN) , 通过对局部神经元创建响应竞争机制, 提高了网络的泛化能力。使用重叠的最大池化层代替平均池化, 很好地解决了平均池化的模糊问题, 同时在一定程度上提高了图像特征的丰富性。AlexNet 模型相比于LeNet5 和传统的机器学习方法具有更高的识别精度, 但是本身的参数量巨大, 模型的训练时间长,识别速度慢。

基于AlexNet卷积神经网络的手写体数字倾斜校正系统研究-附Matlab代码_第1张图片

图1 AlexNet 网络模型

✳️ 三、实验验证

✳️ 3.1 实验数据集

MNIST 数据集是一个手写体数字识别数据集, 包含 50 000 条训练数据集和 10 000 条测试数据集。数据集包含 250 个不同人手写的阿拉伯数字 0 ~ 9, 共 10 类手写体数字图像。每条数据集由图像和标签组成, 每张图像的大小为 28×28 = 784的一维数组, 标签类型为 One-Hot-Encoding 编码格式。部分数据集图像如图2所示。

基于AlexNet卷积神经网络的手写体数字倾斜校正系统研究-附Matlab代码_第2张图片

图2 MNIST 数据集部分图像

✳️ 3.2 数据训练

训练周期设置100轮,每轮迭代次数设置为50,从图3图4中可知,随着训练迭代步数的增加,RMSE曲线、Loss曲线呈现明显的下降趋势,表明该网络模型可有效进行回归预测。

基于AlexNet卷积神经网络的手写体数字倾斜校正系统研究-附Matlab代码_第3张图片

图3 AlexNet的训练结果

基于AlexNet卷积神经网络的手写体数字倾斜校正系统研究-附Matlab代码_第4张图片

图4 AlexNet的训练结果

✳️ 3.3 手写体倾斜数字校正结果

基于AlexNet卷积神经网络的手写体数字倾斜校正结果如下图所示,可知, 该手写体的倾斜角度为12.6°

基于AlexNet卷积神经网络的手写体数字倾斜校正系统研究-附Matlab代码_第5张图片

图5 手写体数字倾斜校正结果

✳️ 四、参考文献

[1] 王梅,李东旭.基于改进VGG-16和朴素贝叶斯的手写数字识别[J].现代电子技术,2020,43(12):176-181+186.
[2] 张成,戴俊峰,熊闻心.融合LeNet-5改进的扫描文档手写日期识别[J].计算机工程与应用,2021,57(9):207-211.
[3] 杨旭,尚振宏.基于改进AlexNet的人脸表情识别[J].激光与光电子学进展,2020,57(14):243-250.
[4] 黄健,张钢.深度卷积神经网络的目标检测算法综述[J].计算机工程与应用,2020,56(17):12-23.
[5] 汪雅琴,夏春蕾,戴曙光.基于LeNet-5模型的手写数字识别优化方法[J].计算机与数字工程,2019,47(12):3177-3181.

✳️ 五、Matlab代码获取

上述实验由Matlab编程实现,可私信博主获取。


博主简介:研究方向涉及智能图像处理、深度学习、卷积神经网络等领域,先后发表过多篇SCI论文,在科研方面经验丰富。任何与算法程序科研方面的问题,均可私信交流讨论


你可能感兴趣的:(#,3.1,图像识别,三,深度学习,AlexNet,卷积神经网络,手写体数字倾斜校正,图像校正,手写体数字识别)