Tensorflow笔记之图像识别常用数据集简介

1 图像识别问题简介及经典数据集

  视觉是人类认识世界非常重要的一种知觉。对于计算机来说,让计算机识别图片中的内容是很困难的。常用的经典数据集如下:

MNIST手写体识别数据集是一个相对简单的数据集,在其他更加复杂的图像识别处理集上,卷积神经网络有更加突出的表现。CIFAR数据集就是一个影响力很大的图像分类数据集。CIFAR数据集分为CIFAR-10和CIFAR-100两个问题,他们都是图像词典项目(Visual-Dictionary)中800万张图片中的一个子集。CIFAR数据集中的图片为32X32的彩色图片。

CIFAR-10问题收集了来自10个不同种类的60000张图片。相比真实环境的图像识别问题,有2个最大的问题:第一,现实生活中的图片分辨率要远高于32x32,其图像的分辨率也不会是固定的。第二;现实生活中的物体种类特别多,无论是10种还是100种都远远不够,且一张图片不会只出现一类物体,为了更加贴近实际,产生了ImageNet数据集。

  ImageNet是一个基于WordNet的大型图像数据库。在ImageNet中,将近1500万张图片被关联到了WordNet的大约20000个名词同义词集上。目前每一个与ImageNet相关的WordNet同义词集都代表了现实世界中的一个实体,可以被认为是分类问题的一个类别。

 

你可能感兴趣的:(神经网络,tensorflow,深度学习)