YOLOV8改进:更换PoolFormer主干网络

1.该文章属于YOLOV5/YOLOV7/YOLOV8改进专栏,包含大量的改进方式,主要以2023年的最新文章和2022年的文章提出改进方式。
2.提供更加详细的改进方法,如将注意力机制添加到网络的不同位置,便于做实验,也可以当做论文的创新点。
2.涨点效果:添加PoolFormer主干,有效涨点。
YOLOV8改进:更换PoolFormer主干网络_第1张图片


 

Transformer已经在计算机视觉中展现了巨大的潜力,一个常见的观念是视觉Transformer之所以取得如此不错的效果主要是由于基于self-attention的token mixer模块。但是视觉MLP的近期工作证明将这个token mixer换为spatial MLP依然可以保持相当好的效果。作者并没有在这方面做过多的探究,而是认为这些工作之所以成功的原因是因为他们模型结构采用MetaFormer这样的通用架构(即token mixer+channel MLP(FFN)),至于具体采用哪种token mixer模块,影响并不是那么大。
 

YOLOV8改进:更换PoolFormer主干网络_第2张图片

以YOLOv8的第一个版本进行改进

1.步骤一

新建poolformer.py

# Copyright 2021 Garena Online Private Limited
#
# Licensed under the Apache Li

你可能感兴趣的:(YOLO,目标跟踪,人工智能,信息可视化,python)