深度学习之AlexNet模型

深度学习之AlexNet模型

一、模型介绍

2012年,Alex在ILSVRC竞赛中,刷新了Image Classfication的记录,一举奠定了Deep learning在计算机视觉中的地位。此次竞赛中Alex使用的模型被称为AlexNet模型。

AlexNet网络的基本结构如下图所示:

二、模型解读

AlexNet共有八层,有60M以上的参数量。其前五层是卷积层,后三层是全连接层。最后一个全连接层的输出具有1000个输出的softmax。网络最后的优化目标是最大化平均的multinomial logistic regression。

1、第一个卷积层conv1,AlexNet采用了96个11 * 11 * 3的kernel。在stride为4的情况下对于224 * 224 * 3的图像进行了滤波。换句话说,就是采用了11 * 11的卷积核在3个颜色通道上,步长为4对图像进行了卷积操作。

最初的输入神经元的个数为224 * 224 * 3 = 150528个。对于每一个map来说,间隔为4,因此224/4 = 56,然后减去边缘的一个为55个,也就是本层的map大小为55 * 55。因此,神经元数目为55 * 55 * 96 = 290400。

得到基本的卷积数据后,先进行一次Relu(relu1)以及Norm(norm1)变换,然后进行pooling(pool1),作为输出传递到下一层。本层的feature map数目为96个。

image

2.conv2

image

3.conv3

image

4.conv4

image

5.conv5

image

6.fc1

image

7.fc2

image

8.fc3

image

Reference:

1.http://blog.csdn.net/sunbaigui/article/details/39938097
2.《深度学习-Caffe之经典模型详解与实战》

你可能感兴趣的:(深度学习)