❀YOLOv5学习❀对Focus的理解

focus模块的结构:

❀YOLOv5学习❀对Focus的理解_第1张图片

输入图像后进行分割,再进行连接后进入下一个模块。

图像是怎么进行分割的呢?拿3*4*4进行举例。

❀YOLOv5学习❀对Focus的理解_第2张图片

 3×4×4 的输入通过隔行切片的操作变换为 12×2×2Focus 操作可以在没有参数的情况下将输入维度进行下采样,并且尽可能保留了原有的图像信息。

❀YOLOv5学习❀对Focus的理解_第3张图片

 对图行切片操作,具体操作是在一张图片中每隔一像素拿到一个值似于近下采这样就拿到了四张图片,四张图片互的差不多,但是有信息失,这样WH信息就集中到了通道空入通道充了4倍,即接起片相于原先的RGB三通道模式成了12通道,最后得到的新片再经过操作,最得到了有信息失情下的二倍下采特征Focus下采参数量略多于Conv下采,但是有一定提升效果)。

在YOLOv5中的实现:

❀YOLOv5学习❀对Focus的理解_第4张图片

 个人认为,增加通道,缩减wh的值,更加有利于后期计算。

 看了很多博客和视频,大佬们没说,现在还是很困惑的点。

对Focus的疑问?

1:为什么横向和纵向都隔一个元素取样?是单纯地取样方法吗?

2:focus还有没有其他的功能?

参考博文:

1.yolov5种 focus的作用,下采样保持信息不丢失_AIchiNiurou的博客-CSDN博客_yolov5focus

2.深入浅出Yolo系列之Yolov5核心基础知识完整讲解 - 知乎 (zhihu.com)

你可能感兴趣的:(❀YOLO系列❀,深度学习,人工智能)