YOLOv8踩坑实录 | 关于AP计算及极小目标的优化

作者 | Mr.Felix  编辑 | 极市平台

点击下方卡片,关注“自动驾驶之心”公众号

ADAS巨卷干货,即可获取

点击进入→自动驾驶之心【目标检测】技术交流群

后台回复【2D检测综述】获取鱼眼检测、实时检测、通用2D检测等近5年内所有综述!

导读

 

关于模型验证环节AP值以及小目标检测中的召回率偏低的踩坑详解。 

年初yolov8的更新上线让大家再次感受到"白嫖"的喜悦,项目上用了许久的模型终于可以更新换代。作为"白嫖党"的一员,我目前项目中使用的一直是自己优化的nanodet,所以也希望能借助yolov8实现"无痛涨点"。

但是在模型实际训练过程中,我发现了两个问题:

1、在yolov8模型的验证环节,采用自带验证代码计算得到AP值会与通过COCO数据集官方接口pycocotools计算得到的AP存在几个百分点的差距

2、在yolov8模型相比nanodet模型相比召回率偏低,尤其对于小目标(320*192输入尺寸10*10左右)。

接下来,针对这两个问题会进行分析及实验。

1. 通过对yolov8和pycocotools关于AP计算的方式进行对比,发现两者的差异在于获取PR曲线采样点时是否采用线性插值的方式。

yolov8采用线性插值:

aafddfed0a447a8cba743235bfdb2ad1.png

pycocotools采用临近真值:

YOLOv8踩坑实录 | 关于AP计算及极小目标的优化_第1张图片

两者为什么会有这种差异?AP的计算需要采样点绘制出PR曲线,其中R∈[0:.01:1],共需采样101点。因为PR的原始真值点并不是按照R均匀分布,数量也不固定,所以需要在原始真值点的基础上采样出101个点用于计算AP。

在R依次从0均匀采样到1的过程中,遇到没有对应P真值的情况时,yolov8采用的线性插值方式会寻找左右临近两个真值点通过线性插值计算得到采样点对应P值,而pycocotools采用的临近真值方式则是寻找最接近采样点的真值点的P值作为采样点P值。最后对101个采样得到的P值取均值得到AP。

这样就明显发现两者AP计算存在的差异,尤其在PR曲线波动比较大的类别,两者的结果会差距更大。

个人觉得,pycocotools采用的临近真值方式会更加合理,因为参与计算的P值全部是真值,而yolov8采用的线性插值方式会存在估值误差。另外,pycocotools作为COCO官方接口使用也更广泛。

针对yolov8的AP计算代码做以下修改即可达到和pycocotools相同的结果:

YOLOv8踩坑实录 | 关于AP计算及极小目标的优化_第2张图片

具体代码:

elif method == \'searchsorted\':\
q = np.zeros((101,))\
x = np.linspace(0, 1, 101) \# 101-point interp (COCO)\
inds = np.searchsorted(recall, x, side=\'left\')\
try:\
for ri, pi in enumerate(inds):\
q\[ri\] = precision\[pi\]\
except:\
pass\
q_array = np.array(q)\
ap = np.mean(q_array\[q_array \> -1\])

2、针对小目标召回率低的问题,首先采用和现有优化版nanodet相同策略------增大输出特征图尺寸,使用yolov8n-p2训练。

通过下图明显发现,增大输出特征图尺寸后,yolov8准确率依然占优,整体召回率有明显提升,只有香烟类别召回率依然较nanodet低。

YOLOv8踩坑实录 | 关于AP计算及极小目标的优化_第3张图片

准确率

YOLOv8踩坑实录 | 关于AP计算及极小目标的优化_第4张图片

召回率

接下来,详细对比了nanodet与yolov8的模型结构,最终怀疑是标签分配策略导致。

将yolov8中标签分配方法TAL更换为ATSS后,香烟召回率和手机AP均有明显提升。虽然相同阈值下,除香烟外其他三类准确率略有下降,但是实际效果影响不大。

如果对标签分配方法不太了解,可以参考我之前这篇文章:
单阶段检测算法主流的标签分配方法总结

YOLOv8踩坑实录 | 关于AP计算及极小目标的优化_第5张图片

准确率

YOLOv8踩坑实录 | 关于AP计算及极小目标的优化_第6张图片

召回率

如果大家需要自己绘制上面这些P/R图,我已经集成到pycocotools官方工具中,开源地址:https://github.com/CPFelix/pycocotools。

总结:

在对比不同模型的指标时,最好使用同一统计工具。关于AP的计算,还需强调一点的是在横向对比其他模型时,一定要保证模型输出的置信度阈值和NMS阈值保持一致。

关于yolov8对于小目标的优化,目前行之有效的策略有两种:增大输出特征图标签分配采用ATSS

增大输出特征图很好理解,更大的特征图带来更加精细的底层特征,也意味着更多的候选正样本(落入GT框内),召回率自然会拉升。

而标签分配也是影响最终正样本的重要因素,为什么yolov8使用的TAL会损害小目标的召回呢?

个人看法,欢迎指正:TAL使用模型预测输出的分数和IOU作为度量分数区分正负样本,会存在两个问题:1、冷启动;2、小目标IOU波动大。冷启动的问题在基于模型预测输出区分正负样本的标签分配策略都存在,就是在模型刚开始训练时模型输出是混乱的,正负样本的分配效果也会很差,进而可能导致收敛效果不好。相比中大目标,小目标对于IOU会更加敏感,两个框很小的偏移就会带来IOU很大的差值。两方面因素叠加就会导致最终分配到小目标的正样本偏少,召回率偏低。

另外,在使用ATSS时还可以将锚点框的默认尺寸由5改为3,这样最终生成的默认锚点框会更小,也更适配小目标,会产生更多正样本。

参考文献:

  1. https://github.com/ultralytics/ultralytics

  2. https://github.com/RangiLyu/nanodet

  3. https://github.com/CPFelix/pycocotools

(一)视频课程来了!

自动驾驶之心为大家汇集了毫米波雷达视觉融合、高精地图、BEV感知、多传感器标定、传感器部署、自动驾驶协同感知、语义分割、自动驾驶仿真、L4感知、决策规划、轨迹预测等多个方向学习视频,欢迎大家自取(扫码进入学习)

YOLOv8踩坑实录 | 关于AP计算及极小目标的优化_第7张图片

(扫码学习最新视频)

视频官网:www.zdjszx.com

(二)国内首个自动驾驶学习社区

近1000人的交流社区,和20+自动驾驶技术栈学习路线,想要了解更多自动驾驶感知(分类、检测、分割、关键点、车道线、3D目标检测、Occpuancy、多传感器融合、目标跟踪、光流估计、轨迹预测)、自动驾驶定位建图(SLAM、高精地图)、自动驾驶规划控制、领域技术方案、AI模型部署落地实战、行业动态、岗位发布,欢迎扫描下方二维码,加入自动驾驶之心知识星球,这是一个真正有干货的地方,与领域大佬交流入门、学习、工作、跳槽上的各类难题,日常分享论文+代码+视频,期待交流!

YOLOv8踩坑实录 | 关于AP计算及极小目标的优化_第8张图片

(三)自动驾驶之心】全栈技术交流群

自动驾驶之心是首个自动驾驶开发者社区,聚焦目标检测、语义分割、全景分割、实例分割、关键点检测、车道线、目标跟踪、3D目标检测、BEV感知、多传感器融合、SLAM、光流估计、深度估计、轨迹预测、高精地图、NeRF、规划控制、模型部署落地、自动驾驶仿真测试、产品经理、硬件配置、AI求职交流等方向;

YOLOv8踩坑实录 | 关于AP计算及极小目标的优化_第9张图片

添加汽车人助理微信邀请入群

备注:学校/公司+方向+昵称

你可能感兴趣的:(YOLO,深度学习,计算机视觉,人工智能,目标检测)