关注并星标
从此不迷路
计算机视觉研究院
公众号ID|ComputerVisionGzq
学习群|扫码在主页获取加入方式
代码地址:https://github.com/meituan/YOLOv6
转自《美团技术团队》
计算机视觉研究院专栏
作者:Edison_G
近日,美团视觉智能部研发了一款致力于工业应用的目标检测框架YOLOv6,能够同时专注于检测的精度和推理效率。在研发过程中,视觉智能部不断进行了探索和优化,同时吸取借鉴了学术界和工业界的一些前沿进展和科研成果。在目标检测权威数据集COCO上的实验结果显示,YOLOv6在检测精度和速度方面均超越其他同体量的算法,同时支持多种不同平台的部署,极大简化工程部署时的适配工作。特此开源,希望能帮助到更多的同学。
01
概述
图1-1 YOLOv6 各尺寸模型与其他模型性能对比
图1-2 YOLOv6 与其他模型在不同分辨率下性能对比02
Yolov6关键技术
Hardware-friendly 的骨干网络设计 图2 Roofline Model 介绍图 图3 Rep算子的融合过程[4] 图4 EfficientRep Backbone 结构图 图5 Rep-PAN 结构图03
实验结果及可视化
经过以上优化策略和改进,YOLOv6在多个不同尺寸下的模型均取得了卓越的表现。下表1展示了YOLOv6-nano的消融实验结果,从实验结果可以看出,我们自主设计的检测网络在精度和速度上都带来了很大的增益。
表1 YOLOv6-nano 消融实验结果下表2展示了YOLOv6与当前主流的其他YOLO系列算法相比较的实验结果。从表格中可以看到:
表2 YOLOv6各尺寸模型性能与其他模型的比较04
总结与展望
05
参考文献
[1] YOLOv5, https://github.com/ultralytics/yolov5
[2] YOLOX: Exceeding YOLO Series in 2021, https://arxiv.org/abs/2107.08430
[3] PP-YOLOE: An evolved version of YOLO, https://arxiv.org/abs/2203.16250
[4] RepVGG: Making VGG-style ConvNets Great Again, https://arxiv.org/pdf/2101.03697
[5] CSPNet: A New Backbone that can Enhance Learning Capability of CNN, https://arxiv.org/abs/1911.11929
[6] Path aggregation network for instance segmentation, https://arxiv.org/abs/1803.01534
[7] OTA: Optimal Transport Assignment for Object Detection, https://arxiv.org/abs/2103.14259
[8] Computer Architecture: A Quantitative Approach
[9] SIoU Loss: More Powerful Learning for Bounding Box Regression, https://arxiv.org/abs/2205.12740
06
作者简介
楚怡、凯衡、亦非、程孟、秦皓、一鸣、红亮、林园等,均来自美团基础研发平台/视觉智能部。
© THE END
转载请联系本公众号获得授权
计算机视觉研究院学习群等你加入!
ABOUT
计算机视觉研究院
计算机视觉研究院主要涉及深度学习领域,主要致力于人脸检测、人脸识别,多目标检测、目标跟踪、图像分割等研究方向。研究院接下来会不断分享最新的论文算法新框架,我们这次改革不同点就是,我们要着重”研究“。之后我们会针对相应领域分享实践过程,让大家真正体会摆脱理论的真实场景,培养爱动手编程爱动脑思考的习惯!
VX:2311123606
往期推荐
AI助力社会安全,最新视频异常行为检测方法框架
目前精度最高效率最快存储最小的目标检测模型(附源码下载)
CVPR小目标检测:上下文和注意力机制提升小目标检测(附论文下载)
Double-Head:检测头上再创新,提升精度(附原论文下载)
海康研究院出品:具有场景自适应概念学习的无监督目标检测(附论文下载)
新技术:高效的自监督视觉预训练,局部遮挡再也不用担心!
VS Code支持配置远程同步了
改进的阴影抑制用于光照鲁棒的人脸识别
基于文本驱动用于创建和编辑图像(附源代码)
基于分层自监督学习将视觉Transformer扩展到千兆像素图像
霸榜第一框架:工业检测,基于差异和共性的半监督方法用于图像表面缺陷检测
CLCNet:用分类置信网络重新思考集成建模(附源代码下载)
YOLOS:通过目标检测重新思考Transformer(附源代码)
工业检测:基于密集尺度特征融合&像素级不平衡学习框架(论文下载)
Fast YOLO:用于实时嵌入式目标检测(附论文下载)
计算机视觉研究院:AI部署以及工业落地学习之路(文章较长,建议收藏)
目标检测干货 | 多级特征重复使用大幅度提升检测精度(文末附论文下载