干货提炼|视觉小目标检测模型难点分析与突破

在百度与机器之心联合举办的【三小时AI开发进阶】系列公开课中,百度资深研发工程师倾囊相授,首节课关注视觉模型开发难点:解析小目标检测的技术原理并带来现场实战演示,让我们一文快速回顾本节课的核心干货!

【课程主题】

视觉模型核心难点攻破:小目标检测技术详解与实战

小目标检测场景分析与典型算法详解

在本节课中,讲师首先介绍了视觉AI技术-物体检测的技术发展历程,随着各种检测方法的提出与实践,技术在不断提升其自动化水平与检测效率,满足各类产业落地场景的应用需求。

干货提炼|视觉小目标检测模型难点分析与突破_第1张图片

 

在物体检测这一场景中,“小目标检测”由于实现难度大,是学者与开发者们研究的重点,那什么样的目标算是小目标呢?

干货提炼|视觉小目标检测模型难点分析与突破_第2张图片

以物体检测领域的通用数据集COCO物体定义为例,小目标是指小于32×32个像素点。在实际应用场景中,通常更倾向于使用相对于原图的比例来定义。因此,我们给出相对的定义,物体标注框的长宽乘积,除以整个图像的长宽乘积,再开根号,如果结果小于3%,就称之为小目标。

干货提炼|视觉小目标检测模型难点分析与突破_第3张图片

在应用中,小目标的场景也遍布各行各业,如卫星遥感检测、远距离物体人体检测、无人机航拍巡检缺陷检测、超市货架挡板商品检测等等。那么,为了更好地攻破小目标检测这一视觉模型难点,讲师从四个方面分别解析了场景难点与对应的解决方案。

干货提炼|视觉小目标检测模型难点分析与突破_第4张图片

那么结合实际案例,以上提到的小目标检测技术解决方案能对AI模型的效果有怎样的提升呢?在这个超市挡板商品检测模型中,最初的模型mAP是0.812,但经过Anchor优化、自动数据增强、自动超参搜索优化之后,模型mAP提高到0.92,精度提升超过13%!

干货提炼|视觉小目标检测模型难点分析与突破_第5张图片

在另一个无人机巡检场景中,最初的模型mAP为0.56,远达不到实际应用的要求。通过增加特征金字塔、Anchor自适应算法、自动切图技术,模型mAP提升到0.93,精度提升超过66%,达到了业务应用的要求。

干货提炼|视觉小目标检测模型难点分析与突破_第6张图片

在以上介绍的全部案例中,是什么平台提供了相应能力呢?

EasyDL助力企业快速开发高精度AI模型

面向企业应用开发者,百度推出了EasyDL零门槛AI开发平台,通过极简的交互体验,帮助零算法基础的企业用户快速上手,定制高精度AI模型。目前已经支持图像分类、物体检测、图像分割、音视频分类、语音识别、OCR、表格数据预测、文本分类、情感倾向分析等任务类型,EasyDL提供覆盖数据处理、模型训练与服务部署的全流程功能,助力企业快速打造智能化应用。

干货提炼|视觉小目标检测模型难点分析与突破_第7张图片

EasyDL是基于飞桨开源深度学习平台构建,为用户提供一站式的模型定制开发和服务。在数据管理中,用户可以享受到完善安全的数据服务,包括端云一体的数据采集方案、高级数据清洗、数据扩充、智能标注与近期上线的多人协同标注能力,在多个环节持续提升数据处理效率。

在模型构建环节中,EasyDL支持用户零代码、自动化进行模型训练。在开发者最关注的模型精度问题上,EasyDL预置了百度自研的语义理解模型文心ERNIE2.0与视觉超大规模预训练模型,并提供迁移学习、自动超参搜索、自动数据增强等工具组件,能够让开发者用更少的数据与开发量,获取更优质的效果。在满足精度的同时,为提升训练效率,EasyDL在训练流程中也做了优化,例如分布式训练加速,用户可以自主选择多机多卡的模式,更高效地完成训练流程。同时,为了帮助用户在模型训练后快速了解模型、有针对性地进行模型调优,EasyDL支持在线查看模型的多种指标,包括精确率、召回率、F1-score、mAP等,也有热力图、混淆矩阵等功能更好地对模型效果进行归因分析。
值得一提的是,EasyDL的物体检测模型,使用百度自研超大规模预训练模型的YOLOv3_DarkNet相比普通模型在各类数据集上模型效果平均提升4.53 %、Faster_RCNN相比于普通预训练模型平均提升1.39%。并且在物体检测模型中,EasyDL针对多种场景预置了自适应训练优化机制,并提供了适应广泛业务场景的算法选型,并且在不断根据市场需求进行优化。立足于各类企业应用场景,提供兼具高精度与高性能的模型训练机制。

企业在AI应用时,往往面临部署的“最后一公里”问题。为此,EasyDL提供了灵活的端、边、云多种部署方案,用户可根据业务应用场景要求选择公有云、设备端、私有化、软硬一体的部署方式,更快更好地让AI赋能于各类行业与场景。

干货提炼|视觉小目标检测模型难点分析与突破_第8张图片

 

目前,EasyDL已经在工业制造、安全生产、零售快消、智能硬件、互联网等超过20个行业广泛落地。

另外,百度还推出了BML全功能AI开发平台 (Baidu Machine Learning) ,面向企业和个人开发者提供易用的开发环境丰富的功能组件高性价比的算力资源,完成AI开发的全生命周期管理,助力高效构建高精度AI应用。在模型构建这一环节中,BML支持Notebook、脚本调参、自定义作业的建模方式,给予开发者更高的灵活度,完成高精度模型的定制开发。

在课程中还有讲师实战演示,不到十分钟完成高精度目标检测模型训练,mAP达到98.3%。点击回放视频获取同款开发技能!

下节课的内容提炼关注如何使用BML进行模型算法高效调参,提升模型精度,工程师进阶之路上,不要错过这一课!

【课程回放与QA实录】https://ai.baidu.com/forum/topic/show/981360

【EasyDL官网】https://ai.baidu.com/easydl/

点击阅读原文,立即回顾课程全部内容

落地链接:https://ai.baidu.com/forum/topic/show/981360

你可能感兴趣的:(干货提炼|视觉小目标检测模型难点分析与突破)