每天一个知识点(四)

介绍几个数据集

LFW(labeled faces in the wild)人脸数据库:

主要用来研究非受限情况下的人脸识别问题。

共有13000多张人脸图像,每张图像被标记出人的名字,其中1680人对应不只一张图像。 ​​​

ImageNet数据集:

为了促进计算机图像识别技术的发展而设立的大型图像数据集,超过千万张涵盖生活中大部分看到的图片类别,并已经手工标定好类别。

相比于CIFAR-10,ImageNet数据集图片更多,分辨率更高,类别更多,噪声更多,识别难度更大。

从2010年起,每年ImageNet项目组织都会举办一场ImageNet大规模视觉识别竞赛(ImageNet Large Scale Visual Recognition Challeng,ILSVRC)

CIFAR-10数据集简介:

    CIFAR-10是用于识别普适物品的小型数据集。包含飞机、汽车、鸟类、猫、鹿、狗、蛙类、马、船和卡车这十个类别的图片,一共有50000张训练图片和10000张测试图片,图片尺寸为32*32,3通道彩色RGB图像。相比于MNIST手写字符的灰度图像,CIFAR-10噪声大,物体比例、特征不尽相同。Softmax线性模型表现效果差。

你可能感兴趣的:(每天一个知识点(四))