论文阅读-----DAGER: Deep Age, Gender and Emotion Recognition Using Convolutional Neural Networks

DAGER: Deep Age, Gender and Emotion Recognition Using Convolutional Neural Networks

Dehghan A, Ortiz E G, Shu G, et al. Dager: Deep age, gender and
emotion recognition using convolutional neural network[J]. arXiv
preprint arXiv:1702.04280, 2017.

1、我们提出了一个端到端的管道,以及新颖的深度网络
不仅计算成本低廉,而且还胜过竞争对手
几个基准的方法。
2、我们提供了年龄,情感和性别识别的大型数据集
用于训练最先进的深度神经网络。
3、我们对现有基准进行了多次实验并获得了
所有这些都取得了领先的成果。

论文阅读-----DAGER: Deep Age, Gender and Emotion Recognition Using Convolutional Neural Networks_第1张图片
2.1训练
数据收集:数据收集在训练任何深度神经网络(DNN)中起着重要作用。在本文中,我们的目标是为三个单独的任务标记数据:年龄,性别和情感识别。与流行的分类[8,9]或检测[10]问题相比,收集某些任务的标记数据(如实际年龄估计)要困难得多。这种差距
这是因为估计实际年龄的人为错误很大(有时大于计算机视觉估计),并且人们不能依赖人类注释器来标记具有相应实际年龄的人脸。然而,在Sighthound,我们收集了一个面部的大型数据集,其中包含相应的年龄,性别和情感标签。据我们所知,我们的数据集是学术界或商业界最大或最大的数据集。
下面我们提供一些用于训练模型的数据的统计数据。
**人脸识别:**我们面部识别的基本模型是对超过4万个超过40,000个人的图像进行训练。每个身份的图像的巨大变化使我们的深度模型对面部识别中的常见挑战具有鲁棒性。我们的面部识别模型可通过Sighthound Cloud API 1提供给开发人员。
**年龄估计:**最近在收集相应年龄标签的数据方面做了一些努力[5,11,4]。其中,Rothe等人提出的数据集。 [4]中的最大数据集包含523,051图像,可用于研究目的。但是,数据集未经过仔细注释,并且包含许多错误。另外分配了
不同年龄段的数据非常不平衡。这导致作者仅使用原始论文中的一半数据进行培训[4]。为了更好地解决这个问题,我们收集了大约600,000张具有相应年龄标签的图像的大型数据集。与之前的作品相比,我们的数据集在不同年龄段的分布更均衡。例如,我们的数据集中有超过120,000人,标记年龄超过70岁或小于20岁。我们使用一组人类注释器通过半监督程序进一步清理我们的数据集。
**性别和情感认知:**我们为面部识别任务标记的四百万张面孔也标有相应的性别。为了更好地改进我们的模型,我们添加了成千上万的不同种族和年龄组的图像。此外,我们还使用情感标签为情感识别任务注释了部分数据。

你可能感兴趣的:(表情识别)