深度学习系列-图像分类模型-论文阅读&详解

图像分类是深度学习最早大放异彩的领域,因此也出现了很多经典通用好用的网络模型。这篇blog重点在用一边阅读&理解各个模型的出处论文,一边把相关链接(自认为讲解透彻的)以及笔记记录下来,方便以后查阅。

既然已经有很多人总结得很详细,我就偷个懒不再重复劳动了,啊哈哈

另外,吐个槽,网上的资料真是乱,大家都抄来抄去的,没个准头。为了找个写的明白的资料真实费劲~

CNN发展纵览

网络类型和性能

CNN Architectures history

CNN Architectures: LeNet, AlexNet, VGG, GoogLeNet, ResNet and more ….

不懂得如何优化CNN图像分类模型?这有一份综合设计指南请供查阅

网络类型和性能指标之间有一个非常明显的权衡现象。首先肯定会选择Inception或ResNet网络类型的模型,因为这两个网络比VGG和AlexNet模型更新,只是在精度和仿真速度两个指标之间进行了权衡,如果想要精度,选择ResNet网络是个不错的开端,如果想要仿真速度快,那就选择Inception网络。

AlexNet (2012)

论文:ImageNet Classification with Deep Convolutional Neural Networks

论文翻译:AlexNet论文翻译——中英文对照

论文详解:深度学习AlexNet模型详细分析

GoogleNet/Inception(2014)

论文:

Rethinking the Inception Architecture for Computer Vision

Going Deeper with Convolutions

论文翻译:

Inception-V3论文翻译——中英文对照

GoogleNet论文翻译——中英文对照

论文详解:

从GoogLeNet至Inception v3

大话CNN经典模型:GoogLeNet(从Inception v1到v4的演进

缘由:

我们考虑到一味的追求准确率而增加网络规模有一部分原因就是特征提取模块的设计没有能很好提取出图像的特征,如果能在基本的特征提取单元上做一些优化,然后用优化后的特征提取模块去构建网络,可能会有利于最后的识别效果。由此,Inception 模型孕育而生。

VGGNet (2014)

论文:Very Deep Convolutional Networks for Large-Scale Image Recognition

论文翻译:VGG论文翻译——中英文对照

论文详解:深度学习VGG模型核心拆解

ResNet(2015)

论文:Deep Residual Learning for Image Recognition

论文翻译:ResNet论文翻译——中英文对照

论文详解:ResNet解析

个人觉得,这些模型是研究者经过很多次尝试与实验总结出来的,可以从中窥探深度学习中的“深度”这个概念,值得熟悉。

后续更新中~~~

作者:飞天小小猫

链接:https://www.jianshu.com/p/9a8cd92b66db

來源:

著作权归作者所有,任何形式的转载都请联系作者获得授权并注明出处。

你可能感兴趣的:(深度学习系列-图像分类模型-论文阅读&详解)