暑假听了computer vision的一个Summer School,里面Jason J. Corso讲了他们运用Low-Mid-High层次结构进行Video Understanding 和 Activity Recognition的方法,受益颇深,在这里把他的方法总结一下:
-------------------------------------------------------------------------------------------------
1. 层次结构表示:
3. Activity Recognition
Corso的方法:
思想:建立Space-Time Patch Descriptors,组成visual Words直方图,建立多通道分类器。
找出shikongHarris角点:
要求在feature上进行Densely Sample而非Sparse Sample。
提取Action Feature:f,用HOG/HOF描述
Space-Time Patch描述子形成histogram。每个histogram,是特征点在x,y,t三个分量上的直方图。
但是采用HOG、HOF存在问题,就是只能从前后帧去看,而不能考虑整个球的特征变化。出于这一想法,提出了HOG3D, 该特征在BMVC08中有文章进行具体描述,此处不予赘述,大家有兴趣去看文章吧.
-----------------------------------------------------------------------------------------------------
4.行为轨迹
采用 KLT: Kanade-Lucas-Tomasi Feature Tracker 进行特征点的跟踪,可作为局部特征检测的辅助手段。
classifier 使用SVM分类器:
e.g. 对于打篮球这个action,根据高层表现,将jumping ,throwing, running 加入正样本,将biking,fencing,drumming加入负样本,用SVM进行打篮球二类分类训练。
PS: 作者曾使用L1-Regularization 和 随机森林,都没有明显的改善。
实现Action Bank的建立:
1.选取UCF上的50个action,KTH上6个action和visint.org上的digging action,组成205 templates totally
2.每个action选择3-6个不同视角、style或运动节奏的examples
3.平均分辨率:50×120pixel;40-50frames/example
简单的说呢,就是根据不同视角、style和运动节奏来描述一个templates,由此组成了205个模版,描述57个action。
关于模版
1.只要一个新的视点/运动节奏/style被找到了,就选择该模板
2.每个template都由人工裁剪到时空范围内都有human action的大小
6. 基于Human Pose方法的Activity 识别
将人分为不同part,进行各部分的姿势估计可以清晰的进行model描述。
3D Human Pose Estimation:
7. 基于Parts的Human Pose Estimation
模型结合了局部appearance和对称结构,有多篇文章涉及模型估计:
Pictorial Structures (Fischler & Elschlager 73, Felzenswalb and Huttenlocher 00)
Cardboard People (Yu et al 96)
Body Plans (Forsyth & Fleck 97)
Active Appearance Models (Cootes & Taylor 98)
Constellation Models (Burl et all 98, Fergus et al 03)
采用deformable part model
Slide credit: D. Ramanan. Method is from Yang and Ramanan, CVPR 2011.
9.视频分割:Beyond Points for Video Understanding
标准方法:
ECCV 2012 Xu, Xiong and Corso的方法:将视频看做一个流,根据流向和时间上的马尔科夫假设建立一个估计构架,进行video分割。
Segmentation: S = {S1, S2, ... , Sm}
Input Video: V = {V1, V2, ... , Vm}(时间序列上的输入流)
取S*=arg min E(S|V)
在一个layer的分割中采取:
在整个hierarchy中采取同样假设:
<ECCV 2012 Xu, Xiong and Corso>
转自abcjennifer博客,谢谢原作者abcjennifer