一些常见的数据集汇总

综合数据集

  1. ImageNet
    ImageNet是根据WordNet层次结构组织的图像数据集。在ImageNet中,目标是为了说明每个synset提供平均1000幅图像。 每个concept图像都是质量控制和人为标注的(quality-controlled and human-annotated)。 在完成之后,希望ImageNet能够为WordNet层次结构中的大多数concept提供数千万个干净整理的图像(cleanly sorted images)。
    ImageNet是一项持续的研究工作,旨在为世界各地的研究人员提供易于访问的图像数据库。目前ImageNet中总共有14197122幅图像,总共分为21841个类别(synsets),大类别包括:amphibian、animal、appliance、bird、covering、device、fabric、fish、flower、food、fruit、fungus、furniture、geological formation、invertebrate、mammal、musical instrument、plant、reptile、sport、structure、tool、tree、utensil、vegetable、vehicle、person。
    官方网址:ImageNet

人脸数据集

  1. CelebA
    CelebA是CelebFaces Attribute的缩写,意即名人人脸属性数据集,其包含10,177个名人身份的202,599张人脸图片,每张图片都做好了特征标记,包含人脸bbox标注框、5个人脸特征点坐标以及40个属性标记,CelebA由香港中文大学开放提供,广泛用于人脸相关的计算机视觉训练任务,可用于人脸属性标识训练、人脸检测训练以及landmark标记等,官方网址:Large-scale CelebFaces Attributes (CelebA) Dataset

  2. Helen dataset
    分割
    关键点

  3. RMFD
    口罩遮挡人脸数据集(Real-World Masked Face Dataset,RMFD)。含有:

    • 真实口罩人脸识别数据集:从网络爬取样本,经过整理、清洗和标注后,含525人的5千张口罩人脸、9万正常人脸。下载地址1 密码:j3aq 或者下载地址2
    • 模拟口罩人脸识别数据集: 给公开数据集中的人脸戴上口罩,得到1万人、50万张人脸的模拟口罩人脸数据集。
      • WebFace模拟口罩人脸数据集:下载地址 密码:bts7
      • LFW模拟口罩人脸数据集:下载地址 密码:q7cf
      • AgeDB-30模拟口罩人脸数据集:下载地址 密码: jy5j
      • CFP-FP模拟口罩人脸数据集:下载地址 密码:ebd8
    • 真实口罩人脸验证数据集,包括426个人的4015张人脸图像,组合成3589对相同身份和3589对不同身份的人脸样本对(口罩人脸/正常人脸)。下载地址 密码:tbe6
  4. Wider Face
    由香港中文大学发起的,包含3万张图片共40万张人脸。下载地址

  5. WiderPerson
    多种场景比较拥挤场景的行人检测数据集,包含13382张图片,共计40万个不同遮挡程度的人体。下载地址

你可能感兴趣的:(数据集,深度学习,机器学习,深度学习)