《Focal Loss for Object Detection》阅读笔记

阻碍 One-tage Detector 的性能最大的障碍在于训练数据 class imbalance, 文中通过修改 cross-entropy loss, 降权 well-classified samples 从而模型性能。

以前的方法

R-CNN 系列方法通过 two-stage 级联和启发式采样处理 class imbalance 问题, proposal stage 快速缩小候选目标的位置到一个较小的数量 (eg., 1~2k), 过滤掉大量的背景样本。在第二步进行分类时,启发式采样,固定 foreground-background 比例(1:3)以及 online hard example mining (OHEM), 使得foreground 和 background 的比例更易保持。
相比而言,one-stage detector 需要处理更大的样本空间,这些样本采样与整幅图像。实际上达到了 ~100k 的样本稠密覆盖整个空间位置、尺度、纵横比。而类似的启发式采样无效,整个过程被容易分类的 background samples 主导。因而,为了改善这种无效的问题,提出了 bootstrapping, hard example mining 方法。

你可能感兴趣的:(深度学习与计算机视觉,深度学习,目标检测,损失函数)