开发十年,就只剩下这套Java开发体系了 >>>
参考论文:人群异常识别技术研究进展_魏永超
数据是人群行为识别研究的基础, 为了更加方便开展相关研究工作, 陆续有研究机构采集人群异常行
为数据, 构建了相关数据库并进行公开, 从而一定程度推动了人群行为研究. 这些数据库为行为识别的研
究提供了重要参考依据. 下面将对代表性的人群行为数据库的进行概括。
(1)USCD(University of California, San Diego)异常检测数据库[32]. 数据由加州大学圣地亚哥分校创建,
数据是通过安装在一定高度、俯视人行道的摄像机,采集自然状态下发生的异常行为. 异常行为包含两类:
非人实体闯入和人行为异常. 异常种类包括骑自行车、滑冰、小推车、行人横穿人行道、侵入草地等, 同
时也记录人在轮椅上的几个实例. 数据由 98 个视频组成, 被分成 2 不同的场景的子集, 每个场景录制的视
频录像被分成约 200 帧的各个片段. 该数据库主要针对是人群中个体行为的识别研究.
(2) UMN(University of Minnesota)数据库[33]. 明尼苏达州大学创建的一个数据库, 由 11 个视频组成, 包
含了正常和异常视频. 每个视频起始部分是正常行为,随后为异常行为视频序列. 人群异常行为主要包括:人群单方向跑动、人群四散等. 该视频数据库采集的视频人为安排的异常行为. 该数据库针对的整体人群行为识别.
(3) UCF(University of Central Florida)数据库[34].该数据库由中佛罗里达大学创建, 包含了 99 个视频片段 . 该 数 据 库 主 要 是 收 集 BBC Motion Gallery 、Youtube、Thought Equity 和 Getty-Images 等网站视频数据, 用于公开的科学研究. 特点是在照明和视野的变化, 可以用于拥挤场面开发的算法的性能评价. 该数据集包含的人群和其他高密度移动物体的视频. 可以用于人群行为识别研究以及拥挤人群行为研究.
(4) VIF(violent flow)数据库[35]. 由以色列开放大学创建的人群数据库, 主要关注的是人群暴力行为.由 246 个视频组成, 所有的视频从 YouTube 下载的, 视频来源是真实的现实暴力录影. 数据库旨在为检验暴力/非暴力分类和暴力标准提供测试依据. 视频中, 最短剪辑的持续时间为 1.04 秒, 最长剪辑 6.52 秒, 视频片段的平均长度为 3.60 秒.
(5) CUHK(Chinese University of Hong Kong) 数据库[36]. 该数据集用于拥挤场景下活动或行为研究. 它包括两个子数据集: 交通数据集(麻省理工学院的交通录像)和行人数据集. 交通数据集包括 90 分钟长的交通视频序列, 一些抽样帧的行人基础事实是手动标记的. 行人数据集记录了纽约的大中央车站, 包含一个长 30 分钟的视频, 无任何标记或事实的数据.
(6) MALL 数据库[37]. 该数据集有两个子集: 第一是三个不同的密集的十字路口近 60 分钟的交通流视频; 第二个是从一个可公开访问的购物中心的网络相机上获取的视频. 对 2000 帧视频中的 60000 行人进行了标记, 每一个行人的头部位置也进行了标记. 因此,这个数据集方便于人群计数和轮廓分析的研究.
(7) PETS 2009(Performance Evaluation of Trackingand Surveillance) 数据库[38]. 此数据集包含了多传感器的不同人群的活动序列, 共有 9 个视频. 它由五个组成部分: 校准数据、训练数据、计数和密度估计数据、跟踪数据以及流量分析和事件识别数据. 每个子集包含多个视频序列, 每个序列由 4 到 8 个不同视角拍摄.
(8) RWC(Rodriguezs Web-Collected)收集网络数据库[39]. 罗德里格斯的网络收集的数据集, 由 520 个视频组成. 抓取和下载搜索引擎和素材网站的视频源,例如, Gettyimages 和 YouTube 等, 构建其数据库. 除了大量人群视频外, 数据集还随机从集合中选择所有运动的人中, 记录了 100 个人的地面真实轨迹. 该数据集是不向公众开放的.
(9) UH(University of Haifa)数据库[40]. 视频来自五个采集点的八个摄像机, 分别是食堂 1 个, 地铁入口 1个, 地铁出口 1 个, 车库出口 1 个, 公交车站 1 个, 商场 3 个, 食堂和公交车站采用人为架设摄像机采集,其它地点来自监控. 所有视频中事件都进行了人为标记, 方便算法的测试. 数据库从食堂采集 11 分钟视频,地铁入口 1 小时 36 分视频, 地铁出口 43 分钟视频, 车库出口 5 小时 20 分视频, 公交车站 2 分 20 秒视频, 商场共 155 分钟视频. 异常行为有自然发生, 也有人为设计的
人群异常数据库已经有一定的规模, 且基本都是公开的, 可以用于人群异常行为的研究. 但是, 目前的人群数据库还没有形成体系, 更多的都是研究团队自己采集的视频, 没有相关标准, 视频种类繁多, 这样一定程度限制了人群行为识别的研究. 因此, 标准的人群数据库的建立是需要进一步开展的相关工作.
参考文献:
[32] UCSD Anomaly Detection Dataset, http://www.svcl.ucsd.edu/projects/anomaly/dataset.htm.
[33] UMN Crowd Dataset, http://mha.cs.umn.edu/projevents.shtml#crowd.
[34] Ali S, Shah M. A lagrangian particle dynamics approach forcrowd flow segmentation and stability analysis. IEEEConference on Computer Vision and Pattern Recognition.Minneapolis. CurranAssociates, Inc. 2007. 1–6.
[35] Violence-flows Dataset, http:. www.openu.ac.il/ home/hassner/data/violentflows/index.html.
备用地址: https://www.openu.ac.il/home/hassner/data/violentflows/
[36] Wang X, Ma X, Grimson WEL. Unsupervised activityperception in crowded and complicated scenes usinghierarchical bayesian models. IEEE Trans. on PatternAnalysis and Machine Intelligence, 2009, 31(3): 539–555.
[37] Loy CC, Chen K, Gong S, Xiang T. Crowd counting andprofiling: Methodology and evaluation. Modeling,Simulation and Visual Analysis of Crowds, Springer. 2013,
11: 347–382.
[38] PETS2009 Dataset, http://www.cvg.rdg.ac.uk/PETS2009.
[39] Rodriguez M, Sivic J, Laptev I, Audibert JY. Data-drivencrowd analysis in videos. IEEE International Conference onComputer Vision. Barcelona. Curran Associates, Inc. 2011.1235–1242.
[40] Adam A, Rivlin E, Shimshoni I, Reinitz D. Robust real-timeunusual event detection using multiple fixed-locationmonitors. IEEE Trans. on Pattern Analysis and MachineIntelligence, 2008, 30(3): 555–560.