【论文阅读】Ensemble of pose aligned features for person re-identification

这篇文章是由华中科技大学 图像信息处理与智能控制教育部重点实验室完成,在Control Theory & Applications上被收录,文章对行人重识别的两大挑战:行人姿态变化和场景亮度变化提出改进措施。

在阅读这篇文章过程中感觉自己火候未到,有些内容半知半解,等或一段时间再进行更新

What

1、行人重识别在现实生活中有非常广泛的应用,目前解决这一领域的方法主要有基于表征学习(feature representation)和度量学习(metric learning)两大类。

2、根据姿态对齐方式的不同,行人重识别中的特征可以分为如下三类:
(1)holistic features
整体特征对整个行人进行特征计算,忽略了行人的姿态等变化
(2)Stripe-based features
基于条纹的特征假设图像同一水平面上的条纹代表相同的语义部分,由于这种方法的高效性和简洁性而受到广泛欢迎。
(3)Part-based features
虽然基于部分的特征具有非常好的实现效果,但通过精确的人工解析来实现粒度对齐模型仍然是一个难以解决的问题。

3、
人体语义相同的部分在灰度空间中看上去非常相似,所有人都是一种统一规范的姿势,所以语义相同部分的块可以在特征空间中实现聚类,块的垂直坐标可用于去确定提供信息来确定它是属于哪个部分的。

4、本文的贡献主要如下:
(1)提出一种把外观相似性和空间约束结合在一起的全新姿势对齐方法
(2)在四个颜色空间中计算颜色描述符,并通过结构化输出支持向量机来实现分数级别的融合。

How

1、姿势对齐
针对行人的姿态变化问题,首先对训练集中行人图片进行稠密图像块采样,从而获得图像块集合, 然后对每一个图像块提取其局部表观空间特征, 最后在此特征集上聚类得到通用的行人部件字典. 由于该部件字典编码了行人的部件信息, 因此通过该字典内的每一个码元可以建立两幅行人图像中特定图像块之间的对应关系. 将两幅行人图片的图像块集合分别向部件字典投影, 可以获得2幅行人图片姿态对齐后的图像块序列. 针当模型采用的特征过少时,模型无法对数据进行充分学习,从而忽略了一些训练集中的普遍规律。从这个角度出发,我们可以增加模型特征的维度,通过引入特征组合、高次特征来增大假设空间。

2、光线亮度变化
在姿态对齐后的图像块上分别提取4种颜色描述子, 并将不同颜色描述子下的图像块相似性进行分数级组合以获得更好的亮度不变性. 其中不同颜色描述子之间的组合系数通过结构化输出支持向量机学习得到.
【论文阅读】Ensemble of pose aligned features for person re-identification_第1张图片

结论

与当前的行人重识别最优方法相比,本文提出的方法可以有效提高准确率
【论文阅读】Ensemble of pose aligned features for person re-identification_第2张图片

你可能感兴趣的:(计算机视觉,行人重识别)