WIDER FACE :
GitHub项目Dface用作人脸检测的数据集,RGB图像, 共32203张图片,393703标注人脸 。
含有三个文件夹(train,test,val) train 1.5GB,占比40%,分辨率较高,所有图像宽都缩放到1024,最小标注人脸10*10
test 1.9GB,占比50%,每张图像的人脸数据偏多,平均12.2个人脸每张图片,密集,小人脸非常多。
val 365.4MB,10%占比。
(测试集的标注结果没有公开)
FDDB(Face Detection Data Set and Benchmark) :
人脸检测数据集,包含:2845张图片,其中包含了5171张人脸。包含了各种遮挡,高难度的姿态,低分辨率以及对焦模糊的人脸,用椭圆来标定人脸区域,同时包括灰度图和彩色图。
图片分辨率小,所有图像较长边缩放到450,所有图像都小于450*450,最小标注人脸20*20。
CAISA-web face :
10575人、494414张图片,分辨率250*250,共4.4GB。
LFW(Labeled Faces in the Wild):
无约束自然场景人脸识别数据集,该数据集有5749人/13233张照片,分辨率250*250,其中1680人有2张及以上人脸图片。每张人脸图片都有其唯一的姓名ID和序号加以区分。共212.1MB。
CelebA:
一个名人人脸数据库,包含10177位名人的202599张人脸图片,共24.7GB。每张图像对应40个不同的二值属性标注(如:是否微笑,是否带眼镜,是否戴帽子等)。
CASIA-Face V5:
亚洲人脸图片,该数据集包含了来自500个人的2500张亚洲人脸图片。
The CNBC Face Database:
该数据集采集了200个人在不同状态下(不同的神情,装扮,发型等)的人脸照片。
Fer 2013数据集:
人脸表情数据集,48*48像素,标签:0=angry(愤怒),1=disgust(厌恶),2=fear(恐惧),3=happy(快乐),4=sad(悲伤),5=surprise(惊讶),6=neutral(中立),训练集由28709个例子组成,公共测试集包含3589个示例,私人测试集包含另外3589个示例。
训练集:0-3995张图片,1-436张图片,2-4097张图片,3-7215张图片,4-4830张图片,5-3171张图片,6-4965张图片。
GENKI:
加利福尼亚大学机器概念实验室收集。包含:GENKI-R2009a,GENKI-4K,GENKI-SZSL三部分。
GENKI-R2009a包含11159个图像。
GENKI-4K包含4000个图像,分为“笑”和“不笑两种,2162张为微笑,1838张为非微笑。每个图片的人脸的尺度大小,姿势,光照变化,头的转动等都不一样,专门用作笑脸识别。文件大小为119.5MB。
GENKI-SZSL包含3500个图像,这些图像包括广泛的背景,光照条件,地理位置,个人身份和种族等。
IMDB-WIKI 500k+:
是一个包含名人人脸图像,年龄,性别的数据集,图像和年龄,性别信息从IMDB何wiki网站抓取,总计524230张名人人脸图像及对应的年龄和性别。 IMDB 460723张、wiki 62328张图像。 共10.7GB
CK+:
包含表情的label和Action Units的label,共3.4GB
包括123个subjects,593个image sequence,每个image sequence的最后一张Frame都有action units的label,而在这593个image sequence中,有327个sequence有emotion的label。