机器学习样本数据集,训练正负样本

     1、Caltech-101 数据库:该数据库在2003年被发布,包括101类目标图像和1类背景图像,共102类,彩色图像较多,有部分灰度图像。总共图像数为9145(除去背景后总数为8677),每类图像数大约在31~800之间,图像大小为300×200。此数据库的特点是:每个图像只含有一个目标,且目标大都处于图像中间位置,基本上占据整个图像区域,背景相对比较简单。

             http://www.vision.caltech.edu/Image_Datasets/Caltech101/

     2、Caltech-256 数据库:该数据库在2006年被发布,包括256类目标图像和1类背景图像,共257类。与Caltech101相比主要变化表现在,图像总数达到30608,且每类最少含有80幅图像。

              http://www.vision.caltech.edu/Image_Datasets/Caltech256/

    3、Pascal VOC 数据库:Pascal VOC Challenge(Pascal是Pattern Analysis, Statistical Modeling andComputational Learnin的缩写)是非常著名的视觉目标分类、检测及分割等任务比赛。从2005年到2012年,每年举行一届比赛并公布相应的数据库,该数据
库中每幅图像含有多个类的目标,从2007年开始,每年的数据库均含有20类目标,但具体的目标数不一样。
          该数据库有三个显著的特点,每张图片可能含有多类目标且每类目标可能具有多个实例;目标的大小形状位置相差非常大;图像的背景比较复杂。这些特点给识别任务带来了非常大的困难。

               http://host.robots.ox.ac.uk/pascal/VOC/

    4、行人检测数据库:

               http://pascal.inrialpes.fr/data/human/INRIAPerson.tar                   大小970M

               http://www.cis.upenn.edu/~jshi/ped_html/

你可能感兴趣的:(模式识别&图像处理)