目标检测的算法有哪些?该如何入门?

目标检测是计算机视觉领域中的一个重要研究方向,也是其他复杂视觉任务的基础。 作为图像理 解和计算机视觉的基石,目标检测是解决分割、场景理解、目标跟踪、图像描述和事件检测等更高层次 视觉任务的基础。

目标检测的算法有哪些?该如何入门?_第1张图片

像上图中,这些框框便是我们需要检测出来的目标,每个框框上面会有个小数值,它是识别出来的一个百分比的得分,数值越接近1,准确率也就越高了

那么目标检测中又包含多少种算法呢?本文主要介绍几个经典常见的。

1、R-CNN

R-CNN(Region with CNN Feature)2014年提出,在此之前都是传统的目标检测算法,人为定义特征进行检测,进入了瓶颈期,进步缓慢,但是R-CNN出来之后将目标检测领域的准确率至少提高了30%。

目标检测的算法有哪些?该如何入门?_第2张图片

但是R-CNN也存在一些问题:

  • 测试速度慢;
  • 训练速度慢,过程极其繁琐;
  • 训练所需空间大。

2、Faster R-CNN

2014年R-CNN横空出世,首次将卷积神经网络带入目标检测领域。受SPPnet启发,rbg在15年发表Fast R-CNN,它的构思精巧,流程更为紧凑,大幅提高目标检测速度。

而Faster R-CNN将Fast R-CNN中独立的区域建议生成也改用CNN实现,可以看作是带有RPN分支的Fast R-CNN。

目标检测的算法有哪些?该如何入门?_第3张图片

目标检测的算法有哪些?该如何入门?_第4张图片

Faster R-CNN在“准”、“快”、“简”三个方面,都将目标检测水平提升到一个新高度。

然而,Faster R-CNN也不是完美的。存在的问题主要表现在两个方面:

一是“快”的问题。Faster R-CNN实现了亚秒级(0.2秒)的目标检测,较之前的方法相比,带来的速度提升已经相当可观。但是需求是不断提高的,亚秒级的检测速度在实时应用场合中又显得力不从心。

二是“简”的问题。与之前的方法相比,Faster R-CNN终于将区域建议生成从基于选择性搜索的方法改造为基于RPN的方法,即实现了区域建议生成的“CNN化”。然而正是由于RPN的存在,使得Faster R-CNN的结构变得相当复杂,两阶段的模式实现起来还是比较繁琐的,这一问题通俗的讲就是“结构繁”。

3、YOLO

YOLO(You Only Look Once) 是一种基于深度神经网络的对象识别和定位算法,其最大的特点是运行速度很快,可以用于实时系统。

目标检测的算法有哪些?该如何入门?_第5张图片

YOLO存在的优点是:

  • 速度快,处理速度可以达到45fps,其快速版本(网络较小)甚至可以达到155fps;
  • 泛化能力强 ,可以广泛适用于其他测试集;
  • 背景预测错误率低,因为是整张图片放到网络里面进行预测。

YOLO存在的缺点是:

  • 精度低,小目标和邻近目标检测效果差,小对象检测效果不太好(尤其是一些聚集在一起的小对象),对边框的预测准确度不是很高,总体预测精度略低于Fast RCNN。
  • YOLO与Fast R-CNN相比有较大的定位误差,与基于region proposal的方法相比具有较低的召回率。但是,YOLO在定位识别背景时准确率更高,而 Fast-R-CNN 的假阳性很高。

4、SSD

发表于 ECCV-2016 的 SSD 算法是继 Faster RCNN 和 YOLO 之后又一个杰出的物体检测算法。与 Faster RCNN 和 YOLO 相比,它的识别速度和性能都得到了显著的提高。

目标检测的算法有哪些?该如何入门?_第6张图片

优点:

  • 更过的feature map可以得到更好的效果
  • 使用图片边界标注框比不适用图片标注框效果更好

缺点:

  • 需要人工设置prior box的min_size,max_size和aspect_ratio值。网络中预选框的基础大小和形状需要手工设置。而网络中每一层feature使用的预选框的大小和形状不一样,导致调试过程非常依赖经验。
  • 虽然采用了特征金字塔思路,但对小目标的识别效果依然一般,可能因为ssd使用conv4_3低级feature取检测小目标,而低级特征卷积层数少,存在特征提取不充分问题。

随着深度学习的快速发展,目标检测也得到了越来越多地应用,也有越来越多的算法被应用到建模中。

但是算法种类太多,也就面临着一个问题,该如何选择哪个算法进行建模?毕竟炼丹师称号不是白来的,谁也不想浪费过多时间在无用的模型筛选上。

文章最后推荐一款快速筛选可能AI模型的平台:CooVally。

CooVally限时特惠|花最少的时间,投最少的资金,开发最实用的AI系统

目标检测的算法有哪些?该如何入门?_第7张图片

Coovally内置丰富的模型与应用场景,帮助用户快速进行模型筛选,提高AI模型建模效率。

不仅支持目标检测、语义分割、实例分割、图像分类,还支持在线或离线自动训练AI模型、数据标注、边缘设备SDK部署模型。

目标检测的算法有哪些?该如何入门?_第8张图片

为了让更多用户体验CooVally的快捷和高效,最近还有低价就能获得账号终身使用权的活动,等你来体验哦~


参考文章:

经典的目标检测算法汇总 - 知乎

目标检测那点儿事——人人都在用的Faster R-CNN,其实没那么简单 - 知乎

https://www.cnblogs.com/cropmodel/p/13398667.html

https://blog.csdn.net/weixin_45

你可能感兴趣的:(人工智能,ai,深度学习,目标检测,目标跟踪)