ARFace:基于强化学习的注意感知和正则化人脸识别

ARFace:基于强化学习的注意感知和正则化人脸识别

摘要

不同的人脸区域对识别的贡献不同。特别是在野外环境中,由于受到大量干扰,贡献度的差异会进一步放大。基于此,本文提出了一种基于深度卷积神经网络和强化学习的注意感知人脸识别方法。该方法由注意网和特征网组成。利用Attention-Net根据人脸地标选择输入人脸图像中的patch,并进行强化学习训练,使识别精度最大化。利用特征网提取判别嵌入特征。此外,还介绍了一种正则化方法。输入层的掩码也被应用到中间特征图中,这是一种近似,针对不同的人脸补丁训练一系列模型,提供一个组合模型。将该方法应用于公众流行的人脸验证数据库,取得了满意的识别效果。

  1. INTRODUCTION
    人脸识别技术已经成为我们日常生活中不可分割的一部分,其应用已经渗透到金融、公安、政务、交通等各个领域,也渗透到零售服务领域。 经过不断的努力,计算机视觉,尤其是人脸识别领域的巨大进步,[1]-[5]正是由于深度卷积神经网络的发展而带来的。 针对人脸识别问题的解决方案,通常认为它是一个多分类任务,利用softmax损失函数及其变种,如SphereFace[3]和ArcFace[4],明确地强制类间角度约束,以最大化人脸类别可分性。 此外,采用三重态损失[6]、中心损失[7]等方法,利用欧氏距离代替余弦距离实现人脸相似度的度量学习。
    通过对上述文献的调查,现有的研究通常更强调通过设计损失函数来获得判别特征[3],[4],[8],[9]。这些方法极大地提高了人脸识别的性能,但在野外面对不受约束的情况时仍然存在缺陷。在处理无约束人脸识别时,姿态变化和大规模遮挡等因素会对人脸识别性能产生较大影响。许多研究证实,不同的面部区域对识别[2]、[10]、[11]有不同的贡献。尤其是在野外环境中,由于有很多的干扰,这些差异会被进一步放大。为了研究不同人脸区域对差异的影响,Sun等人实现了DeepID[2],从不同区域、尺度和通道对应的人脸斑块中提取特征,得到互补的、过完整的表示。然后,在DeepID2[10]和DeepID2+[11]中,采用面分区方法。百度[12]提出的人脸识别方法也遵循该方法,将人脸图像按照人脸地标将人脸图像分割成多个部分重叠的patch。采用相同的网络提取不同区域的人脸特征。
    DeepID[2]、[10]、[11]系列以及百度[12]提出的方法都使用了面分区策略。将多个人脸块的特征进行组合,得到过完备特征。但是,这两种算法都有大量的参数,训练和推理都很耗时。我们认为,人脸不同区域的斑块对人脸识别性能的影响是不同的。一些不重要的面部障碍,如严重的咬合,甚至可能对识别产生负面影响。

你可能感兴趣的:(人工智能)