VGG16学习笔记(一)

VGG16中的16指的是有16个卷积层和全连接层
VGG16的图示如下:
VGG16学习笔记(一)_第1张图片
输入层: 224 * 224 * 3
Conv-64: 224 * 224 * 64
Conv-64: 224 * 224 * 64
Pool2: 112 * 112 * 64 //MAX POOL
Conv-128: 112 * 112 * 128
Conv-128: 112 * 112 * 128
Pool2: 56 * 56 * 128
Conv3-256: 56 * 56 * 256
Conv3-256: 56 * 56 * 256
Conv3-256: 56 * 56 * 256
Pool2: 28 * 28 * 256
Conv3-512: 28 * 28 * 512
Conv3-512: 28 * 28 * 512
Conv3-512: 28 * 28 * 512
Pool2: 14 * 14 * 512
Conv3-512: 14 * 14 * 512
Conv3-512: 14 * 14 * 512
Conv3-512: 14 * 14 * 512
Pool2: 7 * 7 * 512
FC: 1 * 1 * 4096 //DROPOUT
FC: 1 * 1 * 4096
FC: 1 * 1 * 4096
SOFTMAX:*

VGG有muti-scale方法 可以将图片缩放到不通尺寸 然后随机剪切到224*224(*3) 有利于增加数据量,可以防止过拟合 Mutil-Scale简介

VGG相比于Alex-net:参数更多 层次更深 但所需的迭代次数更少(更小的滤波器)

1*1卷积核:
1. 网络更深;降低维度
2. 增加更多的非线性变换
3. 可以设置更大的步长,能在降低维度的时候尽可能的保留信息
4.(取代FC层)

VGG16与VGG19性能基本接近,所以常用VGG16.

你可能感兴趣的:(机器学习)