转:https://blog.csdn.net/liuxiao214/article/details/78889662
一共12个人体行为识别的数据集,基于视频的;
6个图像识别的,有关物体识别、行人识别、年龄识别和人头检测的,基于图像,图像识别数据集参考于博客:http://blog.csdn.net/qq_14845119/article/details/51913171
后续可能还会补充。
1、Weizmann
内容:
1、10个类别,每个类别9个视频,背景单一。
2、180x144
下载链接: http://www.wisdom.weizmann.ac.il/~vision/SpaceTimeActions.html
2、KTH
内容:
1、共25个人采集,6个类别,每个类别4个情境,3中室外,1种室内,共600个视频。
2、给出了每个视频4个片段的始末帧位置。
3、规格:160x120,25fps。
下载链接: http://www.nada.kth.se/cvap/actions/
3、Fire Detection
内容: 共6个视频,火灾检测。
下载链接: http://crcv.ucf.edu/data/fire.php
4、UCF101
内容:
1、共13320个视频101个类别,从YouTube采集的真实场景。
2、分为5大类:人与物交互、baby动作、人人交互、乐器演奏、运动。
3、规格:320x240,25fps,最小视频为28帧。
下载链接: http://crcv.ucf.edu/data/UCF101.php
5、HMDB51
内容:
1、共51个类别,6849个视频。每一个类别至少包含101个视频。
2、从电影、视频网站上采集。
3、包含5大类:面部动作(微笑、大笑、咀嚼、说话);面部与物交互动作(吃饭、喝水、抽烟);身体运动(翻跟斗、拍手、爬上等);身体与物交互运动(梳头发、拔剑等);人人交互运动(击剑、拥抱、接吻等)
下载链接: http://serre-lab.clps.brown.edu/resource/hmdb-a-large-human-motion-database/#dataset
6、VISAL
内容:
1、包含很多数据集,船只数据、纹理合成数据、交通拥挤数据、拥挤人群数据UCSD(行人、人注释、人数、线划分)、人3D姿态数据MADS。
2、可下载拥挤人群和人姿态。
下载链接: http://visal.cs.cityu.edu.hk/downloads/
7、Monitoring Human Activity
内容:
1、数据量很小,且需要单独下载,有空可下载。
下载链接: http://mha.cs.umn.edu/index.shtml
8、HOLLYWOOD2
内容:
1、人体动作:12个类别。
2、场景:10个类别。
3、共3669个视频,20.1个小时。
4、从69部电影中采集。
5、视频样本中行为人的表情、姿态、穿着,以及相机运动、光照变化、遮挡、背景等变化很大,接近于真实场景下的情况,因而对于行为的分析识别极具挑战性。
下载链接: http://www.di.ens.fr/~laptev/actions/hollywood2/
9、YouTube-8M
内容:
1、800万个标注视频,每个视频120s到500s。
下载链接: https://research.google.com/youtube8m/
10、Moments in Time Dataset
内容:
1、100万个标注视频,每个视频3秒。
下载链接: http://moments.csail.mit.edu/
11、TRECVID
内容:
如何下载,没看明白,暂时先不管。
下载链接: http://www-nlpir.nist.gov/projects/tv2008/tv2008.html#1
12、CMU Graphics Lab Motion Capture Database
内容:
应该是一些骨骼点动作捕捉,下载链接分散,很难下载,需要写脚本。
下载链接: http://mocap.cs.cmu.edu/
1、ImageNet
内容: 物体识别
ImageNet是一个计算机视觉系统识别项目,是目前世界上图像识别最大的数据库。是美国斯坦福的计算机科学家李飞飞模拟人类的识别系统建立的。能够从图片识别物体。目前已经包含14197122张图像,是已知的最大的图像数据库。
下载链接: http://www.image-net.org/
2、CIFAR
内容: 物体识别
CIFAR-100由60000张图像构成,包含100个类别,每个类别600张图像,其中500张用于训练,100张用于测试。其中这100个类别又组成了20个大的类别,每个图像包含小类别和大类别两个标签。官网提供了Matlab,C,python三个版本的数据格式。
下载链接: http://www.cs.toronto.edu/~kriz/cifar.html
3、INRIA Person Dataset
内容: 行人检测
Inria数据集是最常使用的行人检测数据集。其中正样本(行人)为png格式,负样本为jpg格式。里面的图片分为只有车,只有人,有车有人,无车无人四个类别。图片像素为70*134,96*160,64*128等。
下载链接: http://pascal.inrialpes.fr/data/human/
4、CaltechPedestrian Detection Benchmark
内容: 行人识别
下载链接: http://www.vision.caltech.edu/Image_Datasets/CaltechPedestrians/
5、Adience
内容: 性别年龄识别
该数据集来源为Flickr相册,由用户使用iPhone5或者其它智能手机设备拍摄,同时具有相应的公众许可。该数据集主要用于进行年龄和性别的未经过滤的面孔估计。同时,里面还进行了相应的landmark的标注。是做性别年龄估计和人脸对齐的一个数据集。图片包含2284个类别和26580张图片。
下载链接: http://www.openu.ac.il/home/hassner/Adience/data.html#agegender
6、HollywoodHeads dataset
内容: 人头检测
该数据集为从视频中截取的图片,包含224740张jpeg格式图片,还有xml格式的标注,和VOC的标注方式一样。
下载链接: http://www.di.ens.fr/willow/research/headdetection/release/HollywoodHeads.zip