论文阅读ImageNet Classification with Deep Convolutional Neural Networks &Going Deeper with Convolutions

LeNet是CNN的开端:输入层,卷积层,池化层,全连接层,输出层五脏俱全,是现代CNN网络的基础组件。

这篇博文介绍了LeNet-5 : http://blog.csdn.net/qiaofangjie/article/details/1682684

LeNet-5:共有7层。

2012年AlexNet网络的极大进步,主要是引入了relu函数,dropout技巧,大规模数据的训练,百万级别的ImageNet图像数据,硬件上GPU的实现等。
后来的VGG,GoogleNet,ResNet等,都是在网络层数上加深,或者是重新设计网络的结构,以增强网络的可表达性,或者说是使网络性能更强,具有更好的识别或者是分类能力。


数据集介绍:

ImageNet是一个拥有超过1500万张带标签的高清图片的数据集,这些图片大约属于2.2万个类别。这些图片收集自网络并由亚马逊的Turk群智工具进行人工标记。从2010年开始,作为帕斯卡物体可视化挑战的一部分,一项被称为ILSVRC的比赛每年都会进行。

ILSVRC使用ImageNet的一个子集,这个子集包含大约1000个类别,每个类别大概包涵1000张图。总共大概有120万张训练图片,5万张验证图片和15万张测试图片。


ImageNet Classfication with Deep Convolutional Neural Networks

中文翻译在:http://blog.csdn.net/motianchi/article/details/50851074

这篇文章训练了一个大型深度卷积神经网络来将ImageNet LSVRC-2010数据集中的120万张高清图片分到1000个不同的类别中。提出的模型就是著名的AlexNet。

AlexNet:共有8个学习层——五个卷积层3个全连接层。

卷积和池化操作的深入理解在:http://blog.csdn.net/u010402786/article/details/51541465

关于Dropout技巧的具体理解在:http://mt.sohu.com/20170306/n482526847.shtml


Going Deeper with Convolutions

中文翻译在:http://blog.csdn.net/motianchi/article/details/50970136

这是Google公司基于ImageNet的ILSVRC比赛做的识别图像的深度卷积神经网——深达22层的Inception实例GoogLeNet《Going Deeper with Convolutions》。

这篇文章提出了一个名为“Inception”的深度卷积神经网结构,其目标是将分类、识别ILSVRC14数据集的技术水平提高一个层次。这一结构的主要特征是对网络内部计算资源的利用进行了优化。

关于goolgenet的讲解:
http://blog.csdn.net/shuzfan/article/details/50738394
http://blog.csdn.net/stdcoutzyx/article/details/40759903

关于系统的细节实现:
http://www.cnblogs.com/gkwang/p/4625410.html

疑问:
http://blog.csdn.net/Buyi_Shizi/article/details/53409536
--->梯度和稀疏性的疑问

GoogleNet学习心得
http://www.cnblogs.com/Allen-rg/p/5833919.html

卷积神经网络简介:
http://www.36dsj.com/archives/24006


你可能感兴趣的:(深度学习)