论文《From Facial Parts Responses to Face Detection: A Deep Learning Approach》笔记

论文:From Facial Parts Responses to Face Detection A Deep Learning Approach.pdf

实现:暂无

这篇论文发表于ICCV2015,很有借鉴意义,论文提出了一个新的概念deep convolutional network (DCN) ,在FDDB数据集上达到了目前世界领先水准,这篇论文可以与之前《Joint Cascade Face Detection and Alignment》结合来看,其实是同一种思想在不同方向上的应用。

论文提出的DCN主要有三点新优势:

1、对遮挡有较强的鲁棒性。

2、可以检测到多角度倾斜人脸。

3、可以从一整张图片中检测出大小不一的人脸。

主要得益于一点,利用人脸上关键点的位置信息判断是否人脸(是不是和之前的JDA有些像啊),总结一下就是先用5个CNN检测全图,5个CNN分别是用于检测头发、眼睛、鼻子、嘴巴、脖子,之后合并五个的结果,利用这些位置信息判决人脸。

Faceness-Net :

Faceless-Net工作流包括三个阶段,生成人脸局部信息特征图,根据打分排序候选框,完善候选框。整个流程如图a所示。

论文《From Facial Parts Responses to Face Detection: A Deep Learning Approach》笔记_第1张图片

在第一阶段,人脸被作为输入放进5个CNN网络,5个输出包含各个器官的位置信息,被整合为一个hf送入下一阶段。

在第二阶段,匹配这些器官位置,对其打分排序。

在第三阶段,一次检测,无需滑窗。

下面分别详述每个阶段:

Partness Maps Extraction :

网络结构如下图所示:

论文《From Facial Parts Responses to Face Detection: A Deep Learning Approach》笔记_第2张图片

研究指出叠加多个卷积层可以获得目标位置。

下图展示了各个网络区分粒度的效果:

论文《From Facial Parts Responses to Face Detection: A Deep Learning Approach》笔记_第3张图片

从图上结果显示,当粒度从物体-非物体,人脸-非人脸,亚洲人脸-欧洲人脸等,升至直发-卷发、微笑-厚嘴唇等这样的器官粒度时,对遮挡人脸的鲁棒性最强,5个网络的分类可以如下表一样,为了获得更好的区分效果,每个网络模型都是从ImageNet训练好的模型微调而来。

论文《From Facial Parts Responses to Face Detection: A Deep Learning Approach》笔记_第4张图片

Ranking Windows by Faceness Measure :

本节讲述如何根据各个器官的位置信息对其打分。这部分有点难,先略过。

Face Detection :

经过上面的步骤处理,生成的候选框已经有较高的召回率,通过训练一个人脸分类和边界回归的CNN可以进一步提升其效果。

方法是用人脸图片微调AlexNet。

你可能感兴趣的:(人脸检测)