本文改进: 新的注意力机制——多尺度空洞注意力(MSDA
)。MSDA 能够模拟小范围内的局部和稀疏的图像块交互;
如何在YOLOv8下使用:1)作为注意力机制放在各个网络位置;2)与C2f结合替代原始的C2f
MSCA多尺度特性在小目标检测领域表现优异
YOLOv8改进专栏:http://t.csdnimg.cn/hGhVK
学姐带你学习YOLOv8,从入门到创新,轻轻松松搞定科研;
论文: 2302.01791.pdf (arxiv.org)
本文提出了一种新颖的多尺度空洞 Transformer
,简称DilateFormer
,以用于视觉识别任务。原有的 ViT