YoloX-Focus网络

Focus网络

Focus网络在Yolov5中首次提出,具体操作是在一张图片中每隔一个像素拿一个值,这个可以获得4个独立的特征层,然后将4个特征层进行堆叠,此时就将宽高维度上的信息转换到了通道维度(因为不论你的图像尺寸是n * 4 * 4 * 3(b * h * w * c)还是n * 8 * 8 * 3等等,通道维度都扩增4倍),再通过卷积的方式提取不同的特征。
focus作用是为了提速,作者提到使用focus层可以减少参数计算,减少cuda的使用内存。原文连接
YoloX-Focus网络_第1张图片
                   Figure 1 4 * 4矩阵
YoloX-Focus网络_第2张图片
                                      Figure2 8 * 8矩阵

其实focus层就是对图片做了一个切片操作。可以看作是一个特殊的下采样操作。拿yolov5s举例,原始的640 * 640 * 3的图像输入Focus结构后,先切片然后堆叠变成320 * 320 * 12的特征图,再经过一次卷积操作,最终变成320 * 320 * 32的特征图,代码实现如下:

class Focus(nn.Module):
    # Focus wh information into c-space
    def __init__(self, c1, c2, k=1, s=1, p=None, g=1, act=True):  # ch_in, ch_out, kernel, stride, padding, groups
        super(Focus, self).__init__()
        self.conv = Conv(c1 * 4, c2, k, s, p, g, act)      # 这里输入通道变成了4倍

    def forward(self, x):  # x(b,c,w,h) -> y(b,4c,w/2,h/2)
        return self.conv(torch.cat([x[..., ::2, ::2], x[..., 1::2, ::2], x[..., ::2, 1::2], x[..., 1::2, 1::2]], 1))

参考-睿智的目标检测53——Pytorch搭建YoloX目标检测平台

你可能感兴趣的:(目标检测,深度学习,pytorch)