视频行为识别之概念介绍和基本的数据集介绍

引言
如今人体行为识别是计算机视觉研究的一个热点,
人体行为识别的目标是从一个未知的视频或者是图像序列中自动分析其中正在进行的行为,基本上分为两类:
(1)简单的行为识别即动作分类,给定一段视频,只需将其正确分类到已知的几个动作类别,
(2)复杂的识别是视频中不仅仅只包含一个动作类别,而是有多个,
系统需自动的识别出动作的类别以及动作的起始时刻。
行为识别的最终目标是分析视频中:
哪些人(who)、在什么时刻(when)、什么地方(where)、干什么事情(what)。即所谓的“W4系统”
人体行为识别应用背景很广泛,主要集中在智能视频监控,病人监护系统,人机交互,虚拟现实,智能家居,智能安防,运动员辅助训练,另外基于内容的视频检索和智能图像压缩等有着广阔的应用前景和潜在的经济价值和社会价值,其中也用到了不少行为识别的方法。

问题提出背景
目标:给定一段视频,通过分析,得到里面人员的动作行为。
问题:可以定义为一个分类问题,通过对预定的样本进行分类训练,解决一个输入视频的多分类问题。
这里提出的问题是简单的图片(视频)分类问题,该问题的前提条件是:场景目标为单人,并且占据图片比较大的比例,如下图所示:

视频行为识别之概念介绍和基本的数据集介绍_第1张图片
一、 基本过程和思想
基本思想是将数据集中视频及分类标签转换为图像(视频帧)和其对应的分类标签,再采用CNN网络对图像进行训练学习和测试,将视频分类问题转化为图形分类问题。具体步骤包括:
(1) 对每个视频(训练和测试视频)以一定的FPS截出视频帧,保存为训练集和测试集,将对图像的分类性能作为所对应视频的分类性能。
(2) 选择一个预先训练好的CNN网络架构和初始权重,迁移学习至某数据集

你可能感兴趣的:(视频行为识别)