【机器学习】图解VGG与ResNet (文末送书)

  • 粉丝福利送书:《 自然语言处理NLP从入门到项目实战》
  • 点赞 收藏 ⭐留言 即可参与抽奖送书
  • 下周二(12月28日)晚上20:00将会在【点赞区和评论区】抽一位粉丝送这本北京大学出版社的书~
  • 详情请看最后的介绍嗷~✨

【机器学习】图解VGG与ResNet (文末送书)_第1张图片

文章目录

  • 1. VGG
    • 1.1 网络输入
    • 1.2 网络各层结构
  • 2. ResNet
  • 福利送书

1. VGG

VGG网络采用小的滤波器, 具有更深的网络结构。3x3 CONV,2x2 MAX POOL

三个 3x3 conv 的堆叠,具备等效于一个7x7 conv 的感受,网络更深,具有更强的非线性。

1.1 网络输入

在训练过程中,网络输入尺寸固定为 224x224 的 RGB 图像,唯一的预处理就是:基于整个训练集计算 RGB 的均值,然后每个像素节点上减去该均值。

1.2 网络各层结构

  • 卷积层

在这里,网络用 3x3 的小尺寸卷积核来提取特征,并用 1x1 的卷积核来作线性转换(后接非线性层)。卷积运算的步长设置为 1,且进行 padding,使得卷积前后尺寸不变。

【机器学习】图解VGG与ResNet (文末送书)_第2张图片

  • 池化层

池化层选取 max-pooling,步长为 2, 尺寸为 2 * 2。 因此,特征图的尺寸变换只发生于池化层。

  • 全连接层

网络最后,接着 3 个全连接层(Fully-Connected layers)。神经元数目分别为:4096,4096,1000,最后 1000 用于 1000 分类。最后用一个 softmax 层,用于计算类别的概率(约束在 0~1 之间,和为 1)。

  • 激活函数

整个网络使用 ReLU 作为非线性激活函数。由于 Local Response Normalisation (LRN) 对网络无益,所以网络未使用。

  • 结构

【机器学习】图解VGG与ResNet (文末送书)_第3张图片

  • 不计算偏置

【机器学习】图解VGG与ResNet (文末送书)_第4张图片

2. ResNet

ResNet网络是参考了VGG19网络,在其基础上进行了修改,并通过短路机制加入了残差单元。

变化主要体现在ResNet直接使用stride=2的卷积做下采样,并且用global average pool层替换了全连接层。

ResNet的一个重要设计原则是:当feature map大小降低一半时,feature map的数量增加一倍,这保持了网络层的复杂度。esNet相比普通网络每两层间增加了短路机制,这就形成了残差学习。

采用残差连接,可以构建非常深的网络结构,ResNet通过残差学习解决了深度网络的退化问题,让我们可以训练出更深的网络!

  • 残差块结构
    【机器学习】图解VGG与ResNet (文末送书)_第5张图片

【机器学习】图解VGG与ResNet (文末送书)_第6张图片

  • 堆叠残差模块
  • 每个残差模块有两个3x3 卷积层
  • 网络的起始有一个额外的卷积层
  • 网络中无全连接层,仅在最后有一个FC 1000用于预测类别
  • 理论上,可以用多种尺寸的输入图像来训练

(最后一个卷积层之后,有一个全局平均池化层。网络中无全连接层,仅在最后用FC1000输出类别。)
【机器学习】图解VGG与ResNet (文末送书)_第7张图片

  • 《实际应用的深层神经网络模型分析》,2017年。
    【机器学习】图解VGG与ResNet (文末送书)_第8张图片

福利送书

【机器学习】图解VGG与ResNet (文末送书)_第9张图片

【内容简介】
本书分为12章

主要包括学习人工智能原理自然语言处理技术掌握深度学习模型NLP开源技术实战Python神经网络计算实战AI语音合成有声小说实战玩转词向量近义词查询系统实战机器翻译系统实战文本情感分析系统实战电话销售语义分析系统实战人工智能辅助写作系统(独家专利技术解密)

本书内容通俗易懂,案例丰富,实用性强,特别适合使用Python语言人工智能自然语言处理的入门和进阶的读者阅读,也适合产品经理、人工智能研究者等对人工智能自然语言处理感兴趣的读者阅读。

【评论区】和 【点赞区】 会抽一位粉丝送出这本书籍嗷~

当然如果没有中奖的话,可以到当当,京东北京大学出版社的自营店进行购买。

也可以关注我!不定期送一本书出去哒~

你可能感兴趣的:(深度学习/机器学习,机器学习,深度学习,神经网络)