本篇文章 基于 YOLOv8网络:首发最新结合苹果最新续作 MobileViTv2 结构(二),提出移动视觉 Transformer 的可分离自注意力机制。该论文提出来的MobileViTv2结构对MobileViT进行升级改进!提出了一种具有线性复杂度的可分离自注意力方法,进一步提高效率,表现SOTA!性能优于Mobile-former等网络, 本文将改进该结构结合YOLOv8系列应用
。
有效涨点!!!
理论部分
和YOLO改进结构代码
,并提出首发原创
X结构
(其他地方没有),进行改进目前最新一共3个版本,分别是MobileViT模型
、MobileViTv2模型
、MobileViTv3模型
,这是三篇不同的论文!!