空洞卷积(Atrous Convolution)

优点:在不做 polling 损失信息和相同的计算条件下的情况下,增大了感受野,让每个卷积输出都包含较大范围的信息。空洞卷积经常应用在实时图像分割中。当网络层需要较大的感受野,但计算资源有限而无法提高卷积核数量或大小时,可以考虑空洞卷积。

空洞卷积(atrous convolutions)又称扩张卷积(dilated convolutions),是针对图像语义分割问题中下采样会降低图像分辨率、丢失信息而提出的一个卷积网络。利用添加空洞扩大感受野,让原本3×3的卷积核,在相同参数量核计算量下拥有5×5(dilated rate=2)或者更大的感受野,从而无需下采样。空洞卷积引入了一个成为“扩张率(dilated rate)”的新参数,该参数定义了卷积核处理数据时各值的间距,换句话说,相比原来的标准卷积,空洞卷积多了一个 hyper-parameter(超参数)称之为 dilation rate(扩张率),指的是 kernel各点之间的间隔数量。

空洞卷积概念

空洞卷积(Atrous Convolution)_第1张图片

红色的点为实际要卷积的像素,两个像素之间的距离,就是 dilation rate(扩张率)。

(a)图对应的3×3的1-dilated conv,核普通的卷积操作一样。

(b)图对应的3×3的2-dialated conv,实际的卷积 kernel size 还是3×3,但是空洞为1,需要注意的是空洞的位置全填进去0,填入0之后再卷积即可,例如下图。
空洞卷积(Atrous Convolution)_第2张图片
©图是4-dilated conv操作。

空洞卷积动态过程

空洞卷积(Atrous Convolution)_第3张图片

你可能感兴趣的:(CV,计算机视觉,深度学习,cnn)