人脸检测-RetinaFace

《RetinaFace: Single-stage Dense Face Localisation in the Wild》

论文地址:https://arxiv.org/pdf/1905.00641.pdf

Insight Face在2019年提出的最新人脸检测模型,原模型使用了deformable convolution和dense regression loss, 在 WiderFace 数据集上达到SOTA。

1、摘要

虽然在未受控制的人脸检测方面取得了巨大进步,但野外准确有效的面部定位仍然是一个开放的挑战。这篇文章提出了一个强大的单阶段人脸检测器,名为RetinaFace,它利用联合监督和自我监督的多任务学习,在各种人脸尺度上执行像素方面的人脸定位。具体来说,我们在以下五个方面做出了贡献:

Retinanet

RetinaFace的mnet本质是基于RetinaNet的结构,采用了特征金字塔的技术,实现了多尺度信息的融合,对检测小物体有重要的作用,RetinaNet的结构如下
人脸检测-RetinaFace_第1张图片
简化版的mnet与RetinaNet采用了相同的proposal策略,即保留了在feature pyramid net的3层特征图每一层检测框分别proposal,生成3个不同尺度上的检测框,每个尺度上又引入了不同尺寸的anchor大小,保证可以检测到不同大小的物体

多任务学习

在分类和回归的基础上加入了目标点的回归。官方的网络结构采用了5个目标点的学习,后续也可以修改为更多目标点,比如AFLW中的21个目标点以及常用的68或者106个目标点
人脸检测-RetinaFace_第2张图片
(2)我们进一步增加了一个自监督网格解码器分支,用于与现有的受控分支并行地预测像素三维形状的面部信息。、

人脸检测-RetinaFace_第3张图片
人脸检测-RetinaFace_第4张图片

Context Modelling

提升模型对于小物体的检测能力,使用了DCN(deformable convolution network)

人脸检测-RetinaFace_第5张图片

Lcls:人脸分类loss

Lbox:人脸框回归loss

Lpts:人脸关键点回归loss,五点

Lpixel:自监督3D Mesh Renderer稠密人脸回归

Mesh Decoder实现:用图卷积替代普通卷积

人脸检测-RetinaFace_第6张图片

你可能感兴趣的:(obeject,detection,人脸检测)