1, The KTH database(2004)
KTH数据集于2004 年的发布,是计算机视觉领域的一个里程碑。此后,许多新的数据库陆续发布。数据库包括在 4个不同场景下 25 个人完成的 6 类动作(walking, jogging, running,boxing, hand waving and hand clapping)共计 2391个视频样本,是当时拍摄的最大的人体动作数据库,它使得采用同样的输入数据对不同算法的性能作系统的评估成为可能。数据库的视频样本中包含了尺度变化、 衣着变化和光照变化,但其背景比较单一,相机也是固定的
2,The Weizmann Dataset(2005)
2005年,以色列 Weizmann institute 发布了Weizmann 数据库。数据库包含了 10个动作(bend, jack, jump, pjump, run,side, skip, walk, wave1,wave2),每个动作有 9 个不同的样本。视频的视角是固定的,背景相对简单,每一帧中只有 1 个人做动作。数据库中标定数据除了类别标记外还包括:前景的行为人剪影和用于背景抽取的背景序列
3,The IXMAS Dataset(2006)
该数据库为多视角数据库,该数据库从五个视角获得,室内四个方向和头顶一共安装5个摄像头,另外背景和光照基本不变。包含了11个人做14个动作,重复3次,这14个动作包括{check watch, cross arms, scratch head, sit down, get up, turnaround, walk, wave, punch, kick, point, pick up, throw (over head), throw (frombottom up)}
4,The Hollywood Dataset(2008、2009)
Hollywood(2008年发布)、Hollywood-2数据库是由法国IRISA研究院发布的。早先发布的数据库基本上都是在受控的环境下拍摄的,所拍摄视频样本有限。2009年发布的Hollywood-2是Hollywood数据库的拓展版,包含了 12 个动作类别和 10个场景共3669个样本,所有样本均是从69部 Hollywood 电影中抽取出来的。视频样本中行为人的表情、姿态、穿着,以及相机运动、光照变化、遮挡、背景等变化很大,接近于真实场景下的情况,因而对于行为的分析识别极具挑战性
5,The UCF Dataset(2007-)
美国University of central Florida(UCF)自2007年以来发布的一系列数据库:1UCF sports action dataset(2008),2UCF Youtube(2008),3UCF50,4UCF101,引起了广泛关注。这些数据库样本来自从 BBC/ESPN的广播电视频道收集的各类运动样本、以及从互联网尤其是视频网站YouTube上下载而来的样本。其中UCF101是目前动作类别数、样本数最多的数据库之一,样本为13320段视频,类别数为101类。
6,The Olympic sports dataset UCF sports action dataset(2010)
Stanford university2010年发布Olympic sports dataset UCF sports action dataset,包含了运动员的各类运动视频。视频都是从YouTube上下载的,包含有16个运动类别的50个视频,标记信息为运动类别
7,The UT-interactiondataset
UT-interaction database是针对交互行为的数据库,包含有6类人人交互的动作(shaking hands, pointing, hugging,pushing, kicking and punching)总共 20 段样本,长度在 1 min 左右。
8,NTU-RGB-D database
NTU RGB + D动作识别数据集由56,880个动作样本组成,包含每个样本的RGB视频,深度图序列,3D骨架数据和红外视频。此数据集由3个Microsoft Kinect v.2相机同时捕获。RGB视频的分辨率为1920×1080,深度图和红外视频均为512×424,3D骨架数据包含每帧25个主要身体关节的三维位置(如下图所示)
Cross-View命名规则:文件命名格式:(示例:S001C001P001R001A001)
S:设置号,共有17组设置
C:相机ID,共有三架
P:人物ID,
R:同一个动作的表演次数
A:动作类别