厦门大学智能多媒体实验室2012 - Summer School日程表

厦门大学智能多媒体实验室2012 - Summer School日程表

地点:行政C#505

 

9月6号星期四

9:00-11:00   庆  Learning Sparse Representations for Human Action Recognition

【摘要】本文将超完备词典学习获得的稀疏表示应用在基于视频的人体动作分类问题中,该方法还能够适用于其他模式识别问题,如人脸识别、人体检测和目标识别等。

     特征的提取方法如下:首先将视频分割为一系列帧数相同的片段,利用高斯和Gabor混合滤波的方法对每个片段的第一帧图像进行兴趣点检测;然后抽取以兴趣点为中心的固定大小的块;最后通过计算块内的二阶、三阶和四阶矩。作者将该特征称为local motion pattern(LMP)特征描述子。

    动作模型的建立采用了稀疏表示的思想,将视频中提取出的一组LMP描述子表示为词典中少量原子的线性组合,文章采用的稀疏编码方法是通过OMP算法求解0范数最小化问题,而超完备词典的学习则采用K-SVD算法;文章提出了shared、class-specific、concatenated三种建立词典的方法,并为每一种方法设计了相应的分类算法。

    为了验证文章所提出的特征描述子和动作建模方法的有效性,作者设计了一系列的对比实验,实验结果表明在大多数数据集上本文提出的LMP描述子优于简单的灰度值、灰度梯度和光流统计直方图,而在其他少数几个数据集上的性能则降低了。在对比稀疏表示和向量量化的建模方法的所有数据集上都表明,基于超完备词典所获得的动作表示方法比已有的BOW(通过聚类和向量量化VQ)的方法更紧凑更丰富,在某些数据集上的识别准确率比BOW提高了10%。而三种词典的建立方法中,class-specific以及所提出的Random Sample Reconstruction算法所获得效果最好。此外为了减少计算量,文章还采用了Random Projection技术对样本特征进行降维。

 

3:00-5:00 张洪博 Learning person-object interactions for action recognition 

    本报告主要介绍图像中人和物交互事件的识别,其研究的关键是:如何对人物之间的交互进行表示,报告中主要介绍三种方法: 

    基于图像底层特征的方法:直接基于图像的底层特征,构建人物和目标交互的表示方法,在报告中主要介绍了Grouplet特征和空间金子塔方法(SPM)。Grouplet特征是Banpeng Yao在CVPR2010年论文《Grouplet: A Structured Image Representation for Recognizing Human and Object Interactions》中提出的,Grouplet是以人脸为参考位置,表示图像中图像块之间的位置和表观特征之间的关系;而SPM方法是Vincent等人在BMVC2010的论文《Recognizing human action in still images: a study of bag-of-feature and part-based representations》中提出的, 传统的SPM方法和DPM方法合并对图像中的行为进行识别。

     基于目标检测的方法:在目标检测的基础上,构建目标之间相互关系的表示方法,从而进行行为识别。针对这类方法报告中以Vincent在NIPS2011的论文《Learning person-object interaction for action recognition in still images》进行讲解。在Vincent的方法中,首先用DPM训练一系列目标检测器,包括目标物体和人体各个部位。通过一个四元组表示各个目标之间的关系,基于这些关系对进行行为识别。 

    基于姿态估计的方法:这类方法中,同时考虑姿态,目标和图像中的事件,通过构建概率图模型表示各个问题之间的关系。这三个问题互为context,更新各自初始检测的结果。在这次报告中,介绍了Banpeng Yao在PAMI2012年论文《Recognizing human-object interactions in still images by modeling the mutual context of objects and human poses》中的工作。

     在这次报告介绍的方法中,发现绕开姿态估计直接对图像中的事件进行识别的方法基本上要考虑如下4点:

   (1)Dense-足够的图像特征表示图像信息;

   (2)part-configuration:能够表示图像的局部信息以及图像局部之间的关系;

   (3)Co-occurance:能够表示图像块和目标之间共现的关系;

   (4)Discrimination:从众多的特征中,抽取出具有更强判别能力的特征。而将姿态估计,目标检测和图像识别的结果互为context,能帮助更新各自的结果,使之更准确。

 

 

 

 

9月7号星期五

9:00-11:00张苗辉  行为识别中的行为和模型表示方法

    姿态估计和动作识别是人的行为分析中两项富有挑战性的研究内容,其主要任务是让计算机能够自动地感知场景中的人“在哪里”和判断人在“干什么”。动作识别是指从图像序列中提取各种运动和表观特征,通过分类器判断人的动作类别,为整个场景的语义理解奠定基础。姿态估计是指从输入的图像序列中推测人体各个部分的姿态参数,如:身体各个部分在三维空间中的位置或者身体各个关节之间的夹角。通过这些姿态参数可以在三维空间中重建人体的运动。

    动作识别主要有运动场模型和基于局部特征的方法。运动场模型主要代表是用运动能量图和运动历史图表示动作视频,在用模版匹配的方法进行识别。基于局部特征的方法在图像识别的领域中取得了巨大的成功,在很多复杂的场景中和有较严重的尺度、视角、遮挡等情况下具有很好的效果。近年来,局部特征的方法已经成为行为分析研究的主流方法。这种方法简要可以概述为提取局部时空兴趣点,再运用词典包方法:进行特征描述,聚类,用聚成的类表示动作,进行识别。

    人体姿态的模型有棍图模型、纸板模型、体模型、SCAPE模型等。棍图是由一组相连接的线段构成的平面图.有时也称为骨架(Skeleton)。棍图将人体的躯干和四肢抽象成血线,各部分之间进接关系由旋转角度确定,棍图的优点是简约而直观。姿态估计可以有两个方向,一个是基于表象的方法,从训练图像中直接学习;一个是基于模型的方法,先根据经验建立好模型。两个各有优缺点,现在也有很多方法将两种结合起来。进行最后姿态估计的方法有:判别模型(discriminative  model)、生成模型(generative model)、判别-生成混合模型。

 

 

3:00-5:00曹冬林

Exploiting the Entire Feature Space with Sparsity for Automatic Image Annotation 

 

9月8号星期六

9:00-11:00陈黎飞(福州师大)   

图/序列挖掘中的几个问题

3:00-5:00吕艳萍

多示例学习研究综述

 

9月9号星期日

9:00-11:00蔡国榕     

Robust Multi-structure Estimation

2:30-4:00 吴云东(集美大学教授)

TBD

4:20-5:50陈煅生(华侨大学教授)  

TBD

6:30-晚宴海韵对面的大丰苑

 

9月10号星期一

9:00-11:00   思 基于检测的目标跟踪方法

    目标跟踪是计算机视觉领域的关键技术,其被广泛应用于自动监控、交通监管和视频检索等领域。由于受到光照、快速运动和遮挡等多种因素的影响,目标跟踪已成为一项富有挑战性的研究课题。目前,基于检测的目标跟踪方法是一种流行的跟踪技术,其通过训练判别式分类器来区别目标和背景。本报告主要介绍了三种具有代表性的基于检测的目标跟踪方法,分别是Online Boosting (Grabner et al., 2006)、Online SemiBoost (Grabner et al., 2008)和Online MILTrack (Babenko et al., 2011)。

    Online Boosting方法(Grabner et al., 2006)首先利用训练样本和样本权重来更新每个选择器中的弱分类器,将具有最低错误率的弱分类器作为选择器,并计算该选择器的投票权重和不断更新样本的权重值,最后合并每个选择器及其权重生成最终的强分类器。

    Grabner等人(Grabner et al., 2008)提出了一种半监督的目标跟踪方法Online SemiBoost。该方法将后序帧中的样本作为未标记样本,并利用未标记样本来更新在线分类器。在每次更新过程中,算法结合先验分类器和在线分类器对未标记样本进行预测。该算法能够在一定程度上避免目标发生漂移。

    Babenko 等(Babenko et al., 2011)将多示例学习的思想引入到目标跟踪领域,提出了一种Online MILTrack算法,能够克服目标选择上的二义性问题。该算法结合了MILBoost算法与Online Boosting算法,利用正负包来不断更新在线分类器,并通过最大化包的对数似然比来选择最优弱分类器。

 

11:00-12:00 & 2:30-3:30耿立川 无人机遥感系统的关键技术及应用

    本报告主要介绍无人机低空遥感系统的关键技术及应用,报告的主要从无人机遥感技术,无人机遥感系统组成,无人机遥感关键技术,无人机遥感系统应用,待研究方向几个方面进行了阐述。报告首先介绍了遥感技术的应用背景,遥感技术的定义以及遥感技术的分类。然后对无人飞行低空遥感的及时性、精细度及灵活性等技术优势进行了介绍。其次,详细介绍和分析了低空航测系统工程的系统组成,包括UAV系统的组成结构、可载传感器系统及低空遥感专用软件等。最后对本人博士论文待研究方向进行了介绍。

 

 

3:30-5:30苏松志 X-able Pedestrian Detector

    本报告主要介绍了行人检测器从“出生”到现在的“进化”过程:从最初Oren等提出的“Trainable”开始,其检测器的能力不断增强,经历了“Deformable”、“Steerable”到“Transferable”等过程,最后介绍了行人检测器样本集的构建方法和一些实现细节,并介绍了提高行人检测速度的方法

你可能感兴趣的:(厦门大学智能多媒体实验室2012 - Summer School日程表)