目标检测识别相关名词介绍

目标检测识别相关名词介绍

  • 目标检测识别相关名词介绍
    • 1 算法
      • 1.1 二阶段算法模型
      • 1.2 一阶段算法模型
        • 1.2.1 YOLO
    • 2 模型
      • 2.1 MobileNet
    • 3 数据集
      • 3.1 Objects365
    • 4.其它

目标检测识别相关名词介绍

最近正有需要做一个目标检测的功能,开始接触各种名词,做一下总结,有不对的地方恳请大佬指正。

1 算法

1.1 二阶段算法模型

在第一阶段提取出若干可能包含目标的候选区域(称为region proposals),这样就去除了大量背景信息。在第二阶段使用卷积神经网络对候选目标区域进一步分类。由于此时的候选区域已经较少了,所以分类比较容易,精度比较高。但是由于分为两阶段,所以速度较慢。代表性算法模型有:RCNN,SPP-net,fast-RCNN,faster-RCNN,FPN等。二阶段算法由于实时性不够,一般不适用于手机端目标检测。
【参考:https://www.cnblogs.com/hillsea/p/13069110.html】

1.2 一阶段算法模型

把目标分类和检测框回归同时实现,具体做法是利用感受野较大的深度网络直接在原图上对目标区域提取特征,并利用特征对目标的bounding box进行回归。由于不需要预先提取region proposal,因此速度较快。但是由于anchor boxes数量很多,存在所谓的“前景——背景”类别不平衡问题(属于背景的anchor boxes数量上明显超过属于目标物的anchor boxes),导致最后目标检测精度比较低。代表性算法模型有:SSD, YOLO。一阶段算法在保持较高检测精度的同时,很好满足了实时性要求,适用于手机端目标检测
【参考:https://www.cnblogs.com/hillsea/p/13069110.html】

1.2.1 YOLO

“YOLO”是一句美语俚语“you live only once”的缩写,字面意思是“人生只有一次”,引申义即“及时行乐”,表达一种人生态度。本模型的名称借鉴了YOLO 这个说法,全名是:You Only Look Once,表示只需要看一次即可完成识别,主要是为了与之前的两阶段(看两次)进行区分。我们人类看到某个场景时,并不会先看一下有没有物体,物体在哪,然后再确定这个物体是什么,而是“只看一次”,就完成目标位置和内容的判断。

2 模型

2.1 MobileNet

为移动和嵌入式设备提出的高效模型。MobileNets基于流线型架构(streamlined),使用深度可分离卷积(depthwise separable convolutions,即Xception变体结构)来构建轻量级深度神经网络。把标准卷积分解成深度卷积(depthwise convolution)和逐点卷积(pointwise convolution)。这么做的好处是可以大幅度降低参数量和计算量

我的理解:mobileNet是一种实现了某种算法的模型,把算法中一些计算复杂的步骤优化了逻辑,使得更加适合嵌入式设备上运行

3 数据集

3.1 Objects365

京旷视科技有限公司与北京智源人工智能研究院共同发布的全球最大的目标检测数据集

4.其它

TensorFlow、caffe 等深度学习框架
https://blog.csdn.net/JCYAO_/article/details/102515924

实现流程:
选一个算法(如YOLOS),利用数据集(如objects356)去训练,得到模型,移植到手机端

你可能感兴趣的:(人工智能,目标检测,人工智能,深度学习)