《Real-Time Rotation-Invariant Face Detection with Progressive Calibration Networks》论文阅读

《使用PCN网络的实时旋转不变人脸检测》论文阅读

摘要

对于人脸的任意角(RIP)检测在应用中有着广泛的需求,但该项任务仍然十分具备挑战性。在处理大量的角度变化问题上,现有的处理办法都在检测速度和精确度上做出了妥协。为了更好地提高检测效率,作者提出了一个PCN网络来对RIP人脸检测从一个由粗到精的检测办法。PCN网络包含了三个步骤,每一个stage不仅进行人脸和非人脸的检测,同时也对每一个人脸候选框进行了角度矫正来提高检测效果。通过把矫正过程划分为几个逐步改进的步骤,并在最早期的检测中只粗略的检测人脸方位,这样一来PCN就可以实现快速的检测和矫正步骤。最后PCN网络能过在360°的全平面准确地检测人脸。作者在github上给出了demo:RIP face detection with PCN

1.背景介绍

人脸检测作为计算机视觉中地重要组成部分,目标就是在人脸图像中提取出有效信息,例如人脸识别、人脸验证、人脸动画等等。这都需要在输出图像中预先快速准确地检测人脸,跟其他的视觉任务一样,由于CNN网络的发展,检测效果都被改善了不少。基于CNN网络的检测器都广泛受益于与生俱来的非线性特征学习的强大能力。然而,大部分的工作都是专注于对于一般的人脸设计一个高效率的检测器,而没有考虑一些特殊的任务。例如图一的对于人脸的全角度检测,旋转不变人脸检测具有相当的挑战性。一个准确的旋转不变性人脸检测器可以极大地促进人脸对齐和人脸识别。

总体来说,有三种策略来处理旋转变化,包括数据增强、分而治之、旋转检测。

数据增强

数据增强是以一个对训练一个旋转不变性人脸检测器最直接地解决办法,通过将朝上地人脸进行全平面角度旋转。这种策略的优势是直接使用了朝上的人脸检测模型进行训练而不需要其他的操作。但是经常需要用到较大的神经网络,并伴随着更多时间的消耗。在很多应用上这不是一个很好的办法。

分而治之

在处理这一问题上,这是另外一种较为常见的方法。主要是训练多个角度检测器,每一个角度检测器仅负责自己角度上的人脸检测,多个角度检测器同时进行检测,这就达到了全平面的多角度人脸检测的要求,但是所带来的是运行时间的消耗和跟多错误的引入。

旋转角度检测器

一个角度检测网络最先被用来去估计每一个人脸候选框的RIP角度,然后根据旋转角度对这些候选框进行旋转矫正。很显然,一个对RIP角度不精确的估计会造成人脸误检测,这直接导致了只有较低的recall。然而对全平面角度人脸的精确检测是很具有挑战性的,所以一个大的神经网络总会被用来作为旋转角度检测网络,这导致了一个高的时间消耗。

作者所提出的PCN网络,是渐进式地对人脸候选框进行RIP全角度检测,使之从[-180, +180],到[-90, +90]逐渐旋转矫正人脸候选框,以及逐步地区分人脸和非人脸。 由PCN-1到PCN-3逐步由粗到细对全角度人脸进行检测。网络地复杂度也逐渐地提升。

 

 

 

你可能感兴趣的:(《Real-Time Rotation-Invariant Face Detection with Progressive Calibration Networks》论文阅读)