视频时序动作检测(temporal action detection)介绍

一、视频时序动作检测算法

本文中动作检测算法也包含了时序动作提名(Temporal Action Proposal Generation)。时序动作提名与检测的类别不一样的地方是,检测一般指定位出动作的边界并给出动作类别(可能是多类),而提名一般只有有动作和没有动作两类。

1.1 提名类算法(temporal action proposal generation)

  • CTAP算法详解
  • TSA-Net论文详解

1.2 检测类算法(temporal action detection / localization)

  • R-C3D论文详解

二、常用数据集介绍

ActivityNet

官网:http://activity-net.org/download.html

该数据集,单视频视长短,包含片段较少(一个视频包含少数的类别动作)

v1.2
* 有9682个视频
* 包含100类动作

v1.3
* 19994个视频
* 包含200类动作
* 日常活动,如遛狗、跳远、打扫地板等
* 共计700小时

两个版本的数据集中,training: validation: testing = 2:1:1
THUMOS14

官网:http://crcv.ucf.edu/THUMOS14/

该数据集,单视频时长可能较长,包含的片段也较多

* 只有验证集和测试集,官方推荐UCF101为训练集(UCF101都是裁剪好的视频)
* 大量的人类动作在真实环境中开源视频。 动作包括日常生活动作(例如,“吹干头发”和“刷牙”)对体育动作(例如,“驾驶”和“高尔夫挥杆”)
* 验证集有200个视频,测试集有213个视频
* 包含20类动作

其它视频任务介绍请查看-文章<<主流的视频动作类算法任务介绍>>

你可能感兴趣的:(视频时序算法,深度学习,计算机视觉,人工智能,时序动作检测,时序动作定位)