目标检测常用名词

目标i检测的一些专业名词

  • 内容
    • anchor box
    • bounding box
    • ground turth
    • IoU
    • nms(非极大值抑制)
    • mAP
    • RPN
    • 前景和背景
    • PR曲线
    • epoch, batch_size,iteration, batch
    • AP50 AP75 APs APl APm(不知道怎么标下标谅解一下)
    • FLOPS FLOPs parameters

内容

主要是对一写常用的术语整理,方便以后翻看,有错的地方欢迎大家指出,没有涉及到的也欢迎大家指出一起整理。1.01的365次方等于多少。

anchor box

候选框,需要手动设置,而且数据集不同的时候,候选框的大小也不同,

bounding box

给出物体在图像中的定位区域的表示,通常包含左上角点的坐标x1,y1, 还有这个检测框的宽高,
–>(x1, y1, H, W)。一般就是预测框

ground turth

在训练集上标注的物体框,一般包含物体的坐标、种类,是真实框

IoU

是预测框和真实框的交集除以并集。IoU = (bounding box 交 ground truth)/ (bounding box 并 ground truth),用来评测算法的检测结果和真是结果的重叠程度,IoU越大说明重叠程度越高,模型的检测效果越好,一般在0-1之间。

nms(非极大值抑制)

在得出IoU之后,使用非极大值抑制,就可以保留同一区域内同一目标IoU最大的那个检测框,从而去点一些多余的重复框。

mAP

这是一个所有类别AP值总和的平均数,用来评价模型的性能,衡量检测器在所有类别上的性能好坏。

RPN

候选区域,通常用于two-stage目标检测器。提取出所有可能包含识别目标的一些区域。RPN做的事情就是,如果存在一个区域,他的
p > 0.5, 则认为它是所检测类别中的某一类,但是具体属于哪一个类还不确定 ,用Network把这一个区域提取出来,就是所谓的感兴趣区域,然后RPN在这些感兴趣的区域上输出bounding box。 意思就是在一张图上面选出一些感兴趣的候选区域,只对这些感兴趣的候选区域进行处理,然后忽略掉那些不感兴趣的背景之类的信息。

前景和背景

在分类问题中,前景就是只要分类的目标,比如车、人、手机……,背景就是只天空、树、草地。

PR曲线

(1)TP 代表的是被正确分类的正样本
(2)TN 代表的是被正确分类的负样本
(3)FP 代表的是 本来是负样本但是却被分成了正样本
(4)FN 代表的是本来是正样本,但是却被分成了负样本
目标检测常用名词_第1张图片
Precision是精度,Recall是召回率
P—R曲线就是根据这两个值来绘制的,在绘制之前需要对每个预测结果根据置信度来排序,从低到高,这样P-R曲线就是呈现一个下降的趋势。详细步骤参考(P-R曲线绘制详细步骤,最后求得mAP)

epoch, batch_size,iteration, batch

epoch --> 使用训练集的全部数据对模型进batch_size行一次完整训练,被称为一个epoch
batch --> 使用训练集的一小部分对模型参数进行一次反向传播参数更新,这样的一小批数据被称 为一个batch,batch = (train set / batch_size)+ 1 (如果不能整除,要+1,反之则不用加)
batch_size --> 每个batch所含有的数据的数量,batch_size = train set / batch
iteration --> 使用一个batch数据对模型进行参数更新的过程,成为一个iteration

我看到的解释的最好的是一篇知乎的文章,博主写的很好,浅显易懂:
示例:
CIFAR10 数据集有 50000 张训练图片,10000 张测试图片。现在选择 Batch Size = 256 对模型进行训练。
每个 Epoch 要训练的图片数量:50000
训练集具有的 Batch 个数:50000 /256 =195 + 1 = 196
每个 Epoch 需要完成的 Batch 个数:196
每个 Epoch 具有的 Iteration 个数:196
每个 Epoch 中发生模型权重更新的次数:196
训练 10 代后,模型权重更新的次数:196 * 10
不同代的训练,其实用的是同一个训练集的数据。第 1 代和第 10 代虽然用的都是训练集的五万张图片,但是对模型的权重更新值却是完全不同的。因为不同代的模型处于代价函数空间上的不同位置,模型的训练代越靠后,越接近谷底,其代价越小。
原文连接

AP50 AP75 APs APl APm(不知道怎么标下标谅解一下)

目标检测常用名词_第2张图片
这里直接截取了一个知乎博主的文章,他写的很好原文连接

FLOPS FLOPs parameters

FLOPS:floating point opreations per second的缩写,意思是每秒浮点数运算次数,可以理解为计算的速度,这是用来衡量硬件的指标。
FLOPs:floating point opreations这里的s代表的是复数,意思是浮点数运算,代表的是计算量。根据计算量的大小用来衡量模型的复杂程度,越大的就越复杂。
parameters:参数量

你可能感兴趣的:(人工智障之目标检测的奇淫技巧,深度学习)