卷积与池化层区别&YOLOV3三问三答

卷积神经网络由卷积核来提取特征,通过池化层对显著特征进行提取,经过多次的堆叠,得到比较高级的特征,最后可以用分类器来分类。

CNN整个的计算过程,最重要的有两点:组合性和局部不变性(平移、旋转、尺度放缩)。

组合性:

每个卷积核可以看做某种特征的提取器。所谓组合性就是将卷积核提取的一些简单特征进行组合,得到更高级的特征。比如图像的人脸分类:

       第一个卷积层,可能只是从原始图像像素中学习到一些边缘特征,第二个卷积层可以从这些边缘特征中探测到简单的形状特征,然后接下来的卷积层,就可以用这些简单的形状特征探测到更高级的特征。比如人脸的形状。

局部不变性:

所谓局部不变性,比如图像,就是图像经过简单的平移、旋转、尺度放缩,池化层在相同的位置依旧可以提取到相同的特征。这是池化层完成的任务。

(1)平移不变性:

       假设有一个16x16的图片,里面有个数字1,我们需要识别出来,这个数字1可能写的偏左一点(图1),这个数字1可能偏右一点(图2),图1到图2相当于向右平移了一个单位,但是图1和图2经过max pooling之后它们都变成了相同的8x8特征矩阵,主要的特征我们捕获到了,同时又将问题的规模从16x16降到了8x8,而且具有平移不变性的特点。图中的a(或b)表示,在原始图片中的这些a(或b)位置,最终都会映射到相同的位置。

卷积与池化层区别&YOLOV3三问三答_第1张图片

(2)旋转不变性:

      下图表示汉字“一”的识别,第一张相对于x轴有倾斜角,第二张是平行于x轴,两张图片相当于做了旋转,经过多次max pooling后具有相同的特征。

卷积与池化层区别&YOLOV3三问三答_第2张图片

 

(3)尺度不变性:

       下图表示数字“0”的识别,第一张的“0”比较大,第二张的“0”进行了较小,相当于作了缩放,同样地,经过多次max pooling后具有相同的特征。

卷积与池化层区别&YOLOV3三问三答_第3张图片

 注:这三种操作只能保证小幅度的变换,如果变换幅度较大,池化层并不能保证这种局部不变性。

池化层:

maxpooling除了刚刚所讲的有局部不变性,还有可以提取显著特征的同时降低模型的参数,从而降低模型的过拟合。

因为只是提取了显著特征,而舍弃了不显著的信息,是的模型的参数减少了,从而一定程度上可以缓解过拟合的产生。

 

2,yolo v3为什么没有用池化层

 

3.,1*1 3*3卷积的不同以及优点

 

4,如何resize Yolo3

参考链接:

https://blog.csdn.net/Hearthougan/article/details/83211183?utm_medium=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-26.nonecase&depth_1-utm_source=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-26.nonecase

你可能感兴趣的:(深度学习V2)