文献阅读(4):手写数字识别

目录

一、简介

1.题目:

2.时间:

3.来源:

4.简介:

5.论文主要贡献:

二、相关名词

三、 相关背景知识

1.阵列处理器

2.Xilinx

四、处理流程概述

1.基于可重构阵列处理器的近数据计算结构:

 2.实现手写数字识别所用的CNN结构:

3.实验效果分析与结论


一、简介

1.题目:

基于近存储计算的手写数字识别实时检测阵列结构设计

2.时间:

2022.12

3.来源:

Journal of Optoelectronics · Laser(光电子·激光)

4.简介:

图像识别中最经典的问题之一 —— 手写数字识别,使用深度学习中的卷积神经网络进行手写数字识别具有更高的准确率,但随之而来的是更加密集的计算和存储,这些都在限制CNN快速高效地实现。该论文在可重构陈列处理器的基础上,利用NMC阵列和数据并行化计算,实现了CNN计算加速,通过降低处理器和主存之间的数据通信实现了手写数字的实时检测。

5.论文主要贡献:

基于可重构阵列处理器的NMC结构,通过CNN并行计算的方法实现了手写数字识别。CNN中最耗费计算资源的卷积运算,本文的实验结果表明提出的方法降低访存延迟以及提高了卷积运算速度,执行单个卷积运算的计算速度比以往研究平均提高了75%。


二、相关名词

ASIC:application specific integrated circuit,专用集成电路

FPGA:filed programmable gate array,现场可编程门阵列

DDR:double data rate,双倍速率同步动态随机存储器

PE:process element,处理元


三、 相关背景知识

1.阵列处理器

阵列处理器(array processor),是用来对大量数据执行计算的处理器,其余还有Multiprocessors(多处理器)和 vector processors(矢量处理器),当有大量数据(如矩阵计算)陈列处理器才最有优势。

阵列处理器可以分为两类:

1.Attached Array Processors

2. SIMD(Single Instruction Stream, Multiple Data Stream) Array Processors

大多数阵列处理器在矢量计算上比主机CPU更快,而且可以与CPU异步运行,因此可以提高系统的整体性能。除此之外,阵列处理器具有自己的本地内存,可以为内存有限的系统提供额外内存。可重构阵列处理器(Reconfigurable array processor),可以在运行时通过配置流程来动态改变PE阵列的功能,然后利用数据流驱动PE。

2.Xilinx

Xilinx(赛灵思)是全球领先的可编程逻辑完整解决方案的供应商,本文中用到的ISE(Integrated Software Environment,集成软件环境)就是xilinx公司的硬件设计工具。Xilinx首创了FPGA这一创新性的技术,并于1985年首次推出商业化产品。如今全世界一半的FPGA产品都来自Xilinx.


四、处理流程概述

1.基于可重构阵列处理器的近数据计算结构:

其中主处理器负责卷积运算中的循环控制,协处理器执行卷积过程中的访存计算指令(寄存器间接寻址)。

DDR中存放卷积运算前原始图像数据、权重和偏置。

文献阅读(4):手写数字识别_第1张图片

 2.实现手写数字识别所用的CNN结构:

文献阅读(4):手写数字识别_第2张图片

论文中设计了一种卷积并行计算的方式:由12个协处理器同时处理两个5×5的卷积运算,其中10个协处理器执行1×5卷积运算,2个协处理器对计算的中间结果进行累加。

3.实验效果分析与结论

文章中的结果是与之前的研究成果进行对比分析的,相较于不同的文献结果,本文中提出的方法均有不同程度的性能提升或者精度提高或者资源消耗减少等等。

你可能感兴趣的:(文献阅读,论文阅读)