Focal Loss for Dense Object Detection笔记

Focal Loss for Dense Object Detection

--目的:目前目标检测的框架一般分为两种,基于候选区域的two-stage的检测框架(稀疏的候选目标位置)和基于回归的one-stage的检测框架(可能的目标位置上常规密集的采样),two-stage的精度高速度慢,one-stage的速度快但是精度稍低。导致其精度低的原因是密集检测器训练时简单-困难两类样本极度不平衡,因此论文目的修改标准的交叉熵损失,能够减小好分类样本的权值损失;Focal loss主要衡量一组稀疏的难分样本并防止简单负样本影响到训练的检测器;

--解决方案:设计并训练密集检测器(RetinaNet);

--结果:RetinaNet与one-stage检测器速度相称,精度高于存在的最新two-stage检测器;

--two-stage最新论文:Feature Pyramid Network (FPN) 和Mask R-CNN;

--two-stage处理类不平衡流程:proposal stage(Selective Search,RPN):过滤大部分背景样本;classification stage:固定的前背景比率或OHEM(online hard example mining);

--one-stage处理类不平衡流程:处理时需处理大量的候选目标,应用与two-stage类似的sampling heuristics时,容易分类的背景样例仍占主导作用,而这种应用对于训练来说是无效率的;典型的技术:bootstrapping和hard example mining;

Focal Loss for Dense Object Detection笔记_第1张图片   Focal Loss for Dense Object Detection笔记_第2张图片

--知识积累:典型的one-stage目标检测方法:boosted detector和DPMs;最近的有SSD;

--类不平衡导致的问题:由于大多数位置都是容易检测的负样本,这不会产生有用的学习信号,使得学习效率低下;容易检测的负样本不利于模型的训练,致使模型分歧;共同的解决方案:hard negative mining(具有细节还没搞清楚);

--焦点损失把训练集中在一组稀疏的困难样例上;

焦点损失

--二分类交叉熵损失公式变换:

可知,   ,其曲线为左上图的蓝线;

--平衡交叉熵:;(的定义类似)

--焦点损失: ;变体: 

--模型初始化:利用π设置模型对稀有类样本的估计的p;焦点损失在单步系统通过损失函数直接解决类不平衡问题(包含了之前所有解决类不平衡的机制);

RetinaNet检测器

Focal Loss for Dense Object Detection笔记_第3张图片

--FPN骨干网络:在ResNet的P3到P7(Pl是输入图片的2^l的分辨率)上构建特征金子塔(FPN),每层特征金字塔有256通道;

--Anchor:P3到P7分别表示32*32到512*512;每层上A=9;ground truth目标box的IOU为[0.5,1],背景样例的IOU为[0,0.4),其余的在训练中忽略,每个Anchor至多一个目标box;

--分类子网络和box回归子网络:两者不共享参数,其结构如图;

--前向和训练:总的焦点损失是约100K个anchor之和(正则化被分置为ground truth box的anchor数量),的选择,两者相互影响;

Focal Loss for Dense Object Detection笔记_第4张图片

--初始化:实验在ResNet-50-FPN和ResNet-101-FPN(ResNet-50和ResNet-101模型在ImageNet1k预训练)两个框架上进行(新加层的初始化见FPN论文);RetinaNet子网络(最后一个卷积层除外):初始化b=0,高斯权重;RetinaNet分类子网络(最后一个卷积层):偏置,这种初始化阻止了大量的背景在第一次迭代时产生一个大而不稳定的损失);

--优化:RetinaNet;SGD(8 GPUs,2 images per GPU,16 images per minibatch);90k迭代;初始学习率0.01(60k和80k时分别除以10);数据扩展:水平图像翻转;weight decay 0.0001;momentum 0.9;焦点损失和标准平滑L1损失;训练时间:10到35个小时;

Focal Loss for Dense Object Detection笔记_第5张图片

实验

--训练数据集:COCO trainval35k(80k train和随机35k val(val总40k));故障和敏感性研究(minval,剩下的5k val);test-dev(评估,无公开的标签数据集,需在线进行评测);

--焦点损失的分析:

Focal Loss for Dense Object Detection笔记_第6张图片

--Hinge损失:结果无意义;

--与最新方法的结果:

Focal Loss for Dense Object Detection笔记_第7张图片

--附录省略

你可能感兴趣的:(论文笔记)