数据集整理

转:https://blog.csdn.net/liuxiao214/article/details/78889662

一共12个人体行为识别的数据集,基于视频的;

6个图像识别的,有关物体识别、行人识别、年龄识别和人头检测的,基于图像,图像识别数据集参考于博客:http://blog.csdn.net/qq_14845119/article/details/51913171

后续可能还会补充。


视频识别


1、Weizmann

内容:

1、10个类别,每个类别9个视频,背景单一。 
2、180x144

下载链接: http://www.wisdom.weizmann.ac.il/~vision/SpaceTimeActions.html


2、KTH

内容:

1、共25个人采集,6个类别,每个类别4个情境,3中室外,1种室内,共600个视频。 
2、给出了每个视频4个片段的始末帧位置。 
3、规格:160x120,25fps。

下载链接: http://www.nada.kth.se/cvap/actions/


3、Fire Detection

内容: 共6个视频,火灾检测。

下载链接: http://crcv.ucf.edu/data/fire.php


4、UCF101

内容:

1、共13320个视频101个类别,从YouTube采集的真实场景。 
2、分为5大类:人与物交互、baby动作、人人交互、乐器演奏、运动。 
3、规格:320x240,25fps,最小视频为28帧。

下载链接: http://crcv.ucf.edu/data/UCF101.php


5、HMDB51

内容:

1、共51个类别,6849个视频。每一个类别至少包含101个视频。 
2、从电影、视频网站上采集。 
3、包含5大类:面部动作(微笑、大笑、咀嚼、说话);面部与物交互动作(吃饭、喝水、抽烟);身体运动(翻跟斗、拍手、爬上等);身体与物交互运动(梳头发、拔剑等);人人交互运动(击剑、拥抱、接吻等)

下载链接: http://serre-lab.clps.brown.edu/resource/hmdb-a-large-human-motion-database/#dataset


6、VISAL

内容:

1、包含很多数据集,船只数据、纹理合成数据、交通拥挤数据、拥挤人群数据UCSD(行人、人注释、人数、线划分)、人3D姿态数据MADS。 
2、可下载拥挤人群和人姿态。

下载链接: http://visal.cs.cityu.edu.hk/downloads/


7、Monitoring Human Activity

内容:

1、数据量很小,且需要单独下载,有空可下载。

下载链接: http://mha.cs.umn.edu/index.shtml


8、HOLLYWOOD2

内容:

1、人体动作:12个类别。 
2、场景:10个类别。 
3、共3669个视频,20.1个小时。 
4、从69部电影中采集。 
5、视频样本中行为人的表情、姿态、穿着,以及相机运动、光照变化、遮挡、背景等变化很大,接近于真实场景下的情况,因而对于行为的分析识别极具挑战性。

下载链接: http://www.di.ens.fr/~laptev/actions/hollywood2/


9、YouTube-8M

内容:

1、800万个标注视频,每个视频120s到500s。

下载链接: https://research.google.com/youtube8m/


10、Moments in Time Dataset

内容:

1、100万个标注视频,每个视频3秒。

下载链接: http://moments.csail.mit.edu/


11、TRECVID

内容:

如何下载,没看明白,暂时先不管。

下载链接: http://www-nlpir.nist.gov/projects/tv2008/tv2008.html#1


12、CMU Graphics Lab Motion Capture Database

内容:

应该是一些骨骼点动作捕捉,下载链接分散,很难下载,需要写脚本。

下载链接: http://mocap.cs.cmu.edu/


图像识别


1、ImageNet

内容: 物体识别

ImageNet是一个计算机视觉系统识别项目,是目前世界上图像识别最大的数据库。是美国斯坦福的计算机科学家李飞飞模拟人类的识别系统建立的。能够从图片识别物体。目前已经包含14197122张图像,是已知的最大的图像数据库。

下载链接: http://www.image-net.org/


2、CIFAR

内容: 物体识别

CIFAR-100由60000张图像构成,包含100个类别,每个类别600张图像,其中500张用于训练,100张用于测试。其中这100个类别又组成了20个大的类别,每个图像包含小类别和大类别两个标签。官网提供了Matlab,C,python三个版本的数据格式。

下载链接: http://www.cs.toronto.edu/~kriz/cifar.html


3、INRIA Person Dataset

内容: 行人检测

Inria数据集是最常使用的行人检测数据集。其中正样本(行人)为png格式,负样本为jpg格式。里面的图片分为只有车,只有人,有车有人,无车无人四个类别。图片像素为70*134,96*160,64*128等。

下载链接: http://pascal.inrialpes.fr/data/human/


4、CaltechPedestrian Detection Benchmark

内容: 行人识别

下载链接: http://www.vision.caltech.edu/Image_Datasets/CaltechPedestrians/


5、Adience

内容: 性别年龄识别

该数据集来源为Flickr相册,由用户使用iPhone5或者其它智能手机设备拍摄,同时具有相应的公众许可。该数据集主要用于进行年龄和性别的未经过滤的面孔估计。同时,里面还进行了相应的landmark的标注。是做性别年龄估计和人脸对齐的一个数据集。图片包含2284个类别和26580张图片。

下载链接: http://www.openu.ac.il/home/hassner/Adience/data.html#agegender


6、HollywoodHeads dataset

内容: 人头检测

该数据集为从视频中截取的图片,包含224740张jpeg格式图片,还有xml格式的标注,和VOC的标注方式一样。

下载链接: http://www.di.ens.fr/willow/research/headdetection/release/HollywoodHeads.zip

你可能感兴趣的:(工作)