深度学习与物体检测每日笔记(1)

深度学习:

  • 深度学习是机器学习的技术分支之一,主要是通过搭建深层的人工神经网络来进行知识的学习。属于监督学习的一种。
  • 监督学习和无监督学习的特点即是否存在标定好的标签(有无答案)。

计算机视觉:

领域应用成就

  1. 图像成像:如修复图像、风格迁移、超分辨率。
  2. 2.5D空间:如光流估计、单目深度、双目深度。
  3. 3D空间:如相机标定、视觉里程计、SLAM(定位与地图构建/Simultaneous Localization and Mapping)。
  4. 环境理解(感知):图像分类、物体检测、图像分割(语义分割和实例分割)、物体跟踪、关键点检测。

物体检测:

  • 定义:通常指在图像中检测出物体出现的位置和类别。处理器输出5个基础量:①物体类别;②xmin;③xmax;④ymin;⑤ymax。
  • 两阶检测:第一阶段专注寻找物体位置,得到建议框,保证准召率;第二个阶段对建议框进行分类。两阶检测精度较高。典型算法:RCNN系列。
  • 一阶检测:在一阶段里完成寻找物体位置和类别预测。一阶检测速度更快。典型算法:SSD/YOLO。

    物体检测评价指标:

  • 定义:通常指在图像中检测出物体出现的位置和类别。处理器输出5个基础量:①物体类别;②xmin;③xmax;④ymin;⑤ymax。
  • 两阶检测:第一阶段专注寻找物体位置,得到建议框,保证准召率;第二个阶段对建议框进行分类。两阶检测精度较高。典型算法:RCNN系列。
  • 一阶检测:在一阶段里完成寻找物体位置和类别预测。一阶检测速度更快。典型算法:SSD/YOLO。
  • 物体检测评价指标:
  • IoU(Insection of Union/联合交叉),指预测框与真实框的交集比并集:
  • \large IoU_{A,B} = \frac{S_{A}\\\cap S_{B}}{S_{A}\ \cup S_{B}}
  • TP(正确检测框/True Positive):指检测框与标签框匹配了,通常指IoU>0.5。
  • FP(误检框/False Positive):指检测框与标签框不匹配,通常指IoU<0.5。
  • FN(漏检框/False Negtive):指未检测出应检模型。
  • TN(正确背景/True Negative):正确背景,通常不需考虑。
  • mAP(mean Average Precision):多个类别平均检测精度。
  • 评测需要每张图片的预测值与标签值。预测边框(Dets):物体类别、边框位置的4个预测值、该物体的得分;标签边框(GTs):物体类别、边框位置的4个真值。
  • AP计算过程如下:深度学习与物体检测每日笔记(1)_第1张图片
  • 遍历预测框,计算预测框与所有标签框GTs的IoU。选取最大IoU的标签GT作为当前预测框匹配对象。若该IoU小于阈值,将该预测框标记未误检框FP。若IoU大于阈值,则查看当前标签框GT是否标记访问过,若没有访问过,则将当前预测框Det标记为正确检测框TP,并将该GT标记为访问过,若GT已访问过,则比较IoU分数大小决定是否替换。
  • 遍历完所有预测框Dets后,我们会把Dets分为TP或FP两类。便可以得到模型召回率R(Recall),即当前一共检测出的标签框TP与所有标签框GTs的比值。
  • 当前遍历过的预测框Dets中,属于正确预测边框的比值即准确率P(Precision),其值大小即检测出的标签框TP与所有预测框(Dets)或者说TP+FP的比值。
  • 通常召回率高时候准确率低,准确率高时候召回率低。
  • 深度学习与物体检测每日笔记(1)_第2张图片
  • 这时AP(Average Precision平均检测精度)便派上用场:
  • \large AP= \int _{0}^{1}PdR
  • 公式代表P-R曲线面积,综合了准确率和召回率。
  • 最后每个类别的AP是独立的,将每个AP进行平均即可得到mAP(严格来讲曲线应先修正后再进行AP计算)。

 

 

你可能感兴趣的:(深度学习,人工智能)