综述:从LeNet 到 GoogLeNet:卷积神经网络的进化

综述:从LeNet 到 GoogLeNet:卷积神经网络的进化

XB D., [email protected]

前言

深度学习的兴起使卷积神经网络在计算机视觉方面大放异彩,本文将按时间和创新点顺序介绍一系列网络结构(LeNet,AlexNet,VGGNet,InceptionNet,ResNet)。网络上大部分文章都只是草草讲述,本文小波仔仔细梳理,从问题的背景,网络结构,为什么设计这样的结构,参数数量各方面详细讲述CNN的进化之路。

LeNet

综述:从LeNet 到 GoogLeNet:卷积神经网络的进化_第1张图片

LeNet 是整个卷积神经网络的开山之作,是卷积神经网络的现代雏形,1998年由LeCun提出。最初设计的目的是识别手写字母,被广泛应用在美国支票手写识别系统当中。

LeNet一共有7层(不包括输入层)
输入层:
输入图像的大小为3232,这要比mnist数据库中的最大字母(2828)还大。
作用: 图像较大,这样做的目的是希望潜在的明显特征,比如笔画断续,角点等能够出现在最高层特征监测子感受野的中心。
其他层:
C1,C3,C5为卷积层,S2,S4为降采样层,F6为全连接层,还有一个

你可能感兴趣的:(计算机视觉,人工智能,计算机视觉综述)