提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档
目录
前言
一、目标检测基础知识
1.1 网络的阶段之分
1.2 单阶段网络为何不如双阶段网络的原因
1.3 双阶段网络如何解决训练中的不均衡
二、常见评价标准
2.1 True positives
2.2 Falase positive
2.3 False negative
2.4 True negatives
2.5 Precision准确率
2.6 Recall召回率
2.7 PR曲线
2.8 IOU指标
图片分类任务我们已经很熟悉了,就是算法对其中的对象进行分类,我们现在开始了解构建神经网络的另一个问题,即目标检测问题。这意味着,我们不仅要算法判断图片中是不是一辆汽车,还要在图片中标记出他的位置来,用边框或者别的框给他圈起来,这就是目标检测的问题。通俗的来说就是让计算机表达出图中是什么,位置在哪里。
提示:以下是本篇文章正文内容,下面案例可供参考
双阶段:第一级网络用于候选区域提取;第二级的网络对提取的候选区域进行分类和精确坐标回归,列如RCNN系列。
一阶段:摒弃了候选区域提取这一个步骤,只用一级网络就完成了分类和回归的两个任务,列如YOLO和SSD系列。
因为训练中的正负列不均衡
负列过多,正列过少,负列产生的损失完全淹没了正列
大多数的负列十分容易区分,网络无法学习到有用的信息。如果训练数据中存在着这样大量的样本,将会导致网络难以收敛。
在RPN网络中,根据前景置信度选择最有可能的候选区域,从而避免容易区分的负列
在训练过程中根据交并比进行采样,将正负的样本比列设置为1:3,防止过多的负列出现
TP:被正确的划分到正例的个数,即实际为正确并把它划分为正例的实例数
FP:被错误的划分为正例的个数,即实际为负例但把他划分为正例的实例数
FN:被错误的划分为负例的个数,即实际为正例但是被划分为负例的实例数
TN:被正确的划分为负例的个数,即实际为负例并把它正确的划分为负例的实例数
们希望检测的结果P越高越好,R越高越好,但实际上这两者在某些情况下是矛盾的。
所以我们需要做到的就是找到一种精确率与召回率召回率之间的平衡,其中的一个方法就是画出PR曲线,然后用PR下方的曲线的面积(AUC)去判断模型的好坏。
IOU是预测框与ground truth的交集和并集的取值,交并比阈值(IOU Threshold)是一个预定义的常数,表示为Ω。当IOU > Ω,认为图像为正样本(包含物体),否则是负样本(不包含物体)
对于每个类,预测框和ground truth重叠的区域是交集,而横跨的总区域就是并集。
AP事实上指的是,利用不用的Precision和Recall的点组合,画出来的曲线下面的面积。
当我们取不同的置信度,可以获得不同的Precison和不同的Recall,我们取得的置信度够密集的时候 ,就可以获得非常多的Precison和Recall
此时Precison和Recall可以在图片上画出一条线,这条线的下部分的面积就是AP,MAP就是所有的类的AP求平均。