目标检测

1. 概念:目标检测是识别图片中物体并确定其位置的多任务技术,面临目标种类数量多、尺度不均、外部环境干扰等问题。

这里的数字为置信度

2. 数据集:VOC数据集分4大类20小类;COCO数据集含20万图像、80个类别、超50万目标标注 ,平均每图7.2个目标。

3. Ground Truth格式:包含类别和边界框坐标,常见的有YOLO(归一化中心点坐标和宽高)、VOC(左上角和右下角坐标)、COCO(左上角坐标和宽高,非归一化)。

4. 评估指标:IoU交并比:交集比并集,越接近1越好

检测结果分TP、FP、TN、FN;Precision(准确率)、Recall(召回率)、P - R曲线、mean AP(类别AP均值)、Average Precision(11点法、近似面积法计算)用于评估模型。

  1. 检测方法:

滑动窗口法需人工设计尺寸,存在冗余和定位不准问题。

深度学习方法中,anchor box用ratio和scale描述,有anchor - base(类似滑动窗口法穷举筛选)和anchor - free(自动生成,不穷举)两类。two stage算法如R - CNN系列,先生成候选区域再分类回归;one stage算法如YOLO系列,直接预测类别和位置。非极大值抑制(NMS)按置信度筛选目标框 。

你可能感兴趣的:(目标检测,人工智能,大数据,pytorch)