深度学习目标检测在实际场景中的应用(附源代码)

关注并星标

从此不迷路

计算机视觉研究院

4386650e0248dd6eb3381aad22ded7ed.gif

深度学习目标检测在实际场景中的应用(附源代码)_第1张图片

公众号IDComputerVisionGzq

学习群扫码在主页获取加入方式

计算机视觉研究院专栏

作者:Edison_G

目标检测是现在最热门的研究课题,目前最流行的还是Yolo系列框架,最近我们计算机视觉研究院也分享了很对目标检测干活及实践,都是Yolo-Base框架,今天我们分享一个经过修改后的Yolov5,实时检测的效果!

开源代码:https://github.com/ultralytics/yolov5/releases

01

2ffba62de3c84258092c5de58344f7c4.png

前言

70ddf3928ac75adbba1429dbf2498ad5.png

目标检测是现在最热门的研究课题,现在的框架越来越多,但是技术的新颖性到了瓶颈,目前开始流行Transformer机制,而且在目标检测领域也能获得较大的提升,也是目前研究的一个热点。

深度学习目标检测在实际场景中的应用(附源代码)_第2张图片

即将举行的亚运会,将会投入更多的先进科技,比如3D成像、姿态估计、目标检测、跟踪及识别!让去全世界看到不一样的中国,不一样的科技,不一样的亚运会。今天我们就说说目标检测会在亚运会中的体现!

深度学习目标检测在实际场景中的应用(附源代码)_第3张图片

深度学习目标检测在实际场景中的应用(附源代码)_第4张图片

目前最流行的还是Yolo系列框架,最近我们“计算机视觉研究院”也分享了很对目标检测干活及实践,都是Yolo-Base框架。

  • 高斯YoloV3目标检测(文中供源码链接)

  • Yolo轻量级网络,超轻算法在各硬件可实现工业级检测效果(附源代码)

  • 不再只有Yolo,现在轻量级检测网络层出不穷(框架解析及部署实践)

  • CVPR21目标检测新框架:不再是YOLO,而是只需要一层特征(干货满满,建议收藏)

02

c76d10abc2f95a58d08e3c4e740e2477.png

新框架改进

461c13be56c8ac1152b4014999b2e2cf.png

今天我们分享一个经过简单优化过的Yolov5,暂时命名为:Pad-YoloV5,在IPad上可以实时检测!基于YoloV5框架,熟悉的同学应该都不用多加解释。

YoloV4在YoloV3的基础上增加了近两年的研究成果,如下:

  1. 输入端采用mosaic数据增强

  2. Backbone上采用了CSPDarknet53、Mish激活函数、Dropblock等方式。(cspnet减少了计算量的同时可以保证准确率)

  3. Mish函数为:

    77aefd76da4a0764a8add2cec7f213e4.png

  4. Neck中采用了SPP、FPN+PAN的结构,

  5. 输出端则采用CIOU_Loss、DIOU_nms操作

YoloV5主要的改变,如下:

  1. 输入端:Mosaic数据增强、自适应锚框计算

  2. Backbone:Focus结构,CSP结构

  3. Neck:FPN+PAN结构

  4. Prediction:GIOU_Loss

这次主要优化,是YoloV5在数据增强的时候,用随机缩放、随机裁剪、随机排布的方式进行拼接,这个对于小目标的检测效果还是很友好的。通过实验发现,这个随机拼接和有规律的拼接,最终的结果还是有一点差别的。

深度学习目标检测在实际场景中的应用(附源代码)_第5张图片

首先我通过修改数据增强的策略,开始对整体数据集进行统计(也就是数据预处理分析),我大致分成三个范围。将最大的与最小的进行随机拼接,最终结果确实比整体随机的效果好!

深度学习目标检测在实际场景中的应用(附源代码)_第6张图片

其次,稍微修改了下自适应图片缩放策略,Yolov5代码中datasets.py的letterbox函数中进行了修改,对原始图像自适应的添加最少的黑边。我是在自适应缩放后的图片,我在右下角位置填边,其实大多数数据没有什么变化,只是随便改改,因为在线都是在Yolo的基础上增加最近几年新出的策略,确实在最后的检查有一定效果的增加。

最后的修改,就是辛苦的把Transformer机制加进了YoloV5的基础框架中,训练确实加快了,但是对于用笔记本训练的成果物,还是不够明显。这也是最近第一次分享实践过程的一些小心思,具体的细节我们“计算机视觉研究院”后期会通过一篇干活详细和大家分享!

© THE END 

转载请联系本公众号获得授权

cd4fd621c957915e5b46f49db8fd27ed.gif

计算机视觉研究院学习群等你加入!

计算机视觉研究院主要涉及深度学习领域,主要致力于人脸检测、人脸识别,多目标检测、目标跟踪、图像分割等研究方向。研究院接下来会不断分享最新的论文算法新框架,我们这次改革不同点就是,我们要着重”研究“。之后我们会针对相应领域分享实践过程,让大家真正体会摆脱理论的真实场景,培养爱动手编程爱动脑思考的习惯!

深度学习目标检测在实际场景中的应用(附源代码)_第7张图片

扫码关注

计算机视觉研究院

公众号ID|ComputerVisionGzq

学习群|扫码在主页获取加入方式

 往期推荐 

  • Label,Verify,Correct:一种简单的Few Shot 目标检测方法

  • SPARSE DETR:具有可学习稀疏性的高效端到端目标检测(源代码下载)

  • 自适应特征融合用于Single-Shot目标检测(附源代码下载)

  • 目标检测:SmartDet、Miti-DETR和Few-Shot Object Detection

  • RestoreDet:低分辨率图像中目标检测

  • Yolo-Z:改进的YOLOv5用于小目标检测(附原论文下载)

  • 零样本目标检测:鲁棒的区域特征合成器用于目标检测(附论文下载)

  • 目标检测创新:一种基于区域的半监督方法,部分标签即可(附原论文下载)

  • 利用先进技术保家卫国:深度学习进行小目标检测(适合初学者入门)

  • 用于精确目标检测的多网格冗余边界框标注

  • 华为诺亚方舟实验室品:加法神经网络在目标检测中的实验研究

  • 多尺度特征融合:为检测学习更好的语义信息(附论文下载)

你可能感兴趣的:(算法,python,计算机视觉,机器学习,人工智能)