2017 ECCV之ReID:Beyond Part Models Person Retrieval with Refined Part Pooling (PCB)

Beyond Part Models Person Retrieval with Refined Part Pooling(and A Strong Convolutional Baseline)
当前的问题及概述
本文使用part特征对行人图像描述提供了细粒度的信息,对所有图像的人物进行分part提取,本文有两点贡献:1,一个名为基于部分卷积基线(PCB)的网络。2,(ii)改进的部分池化(RPP)方法。下图为不同文献的分part方法,本文提出的PCB为f,采用均匀分part的方法,将图像分成均匀的不同条带。
2017 ECCV之ReID:Beyond Part Models Person Retrieval with Refined Part Pooling (PCB)_第1张图片
模型及loss
2017 ECCV之ReID:Beyond Part Models Person Retrieval with Refined Part Pooling (PCB)_第2张图片
2.1PCB: A Part-based Convolutional Baseline
backbone采用ResNet50,在GAP前结构不变并删除GAP及其后的结构,本文定义了沿着轴通道的激活向量作为一个列向量。然后,使用传统的average pooling,PCB将T划分为p个水平条带,之后PCB使用卷积层对g进行降维至256-dim。最后,将每个h输入到一个分类器中,该分类器由一个全连通(FC)层和随后的Softmax函数组成,用于预测输入的标识(ID)。在测试过程中,将g或h的p个片段连接起来,形成最终的descriptor。
2.2Within-Part Inconsistency
区分part内部不一致性,可以看到,下图中即使分part后,也不能和人体每个部分对应:
2017 ECCV之ReID:Beyond Part Models Person Retrieval with Refined Part Pooling (PCB)_第3张图片
所以,在训练PCB收敛后,我们比较每个f和gi (i = 1,2,···,p)的相似性,即,通过测量余弦距离得到各部分的平均集合列向量,这样便找到了最接近每个f的部分。在训练过程中,有许多异常值被指定为一个指定的水平条纹(部分),这些异常值与另一个异常值更为相似。这些异常值的存在表明它们本质上与其他部分的列向量更一致。上图就是在训练过程中通过相似度度量得到的相似区域。
2.3Refined Part Pooling
本文提出了改进的部件池(RPP)来解决part内部的不一致性。本文根据列向量与各部分的相似性来分配所有列向量,以便重新定位异常值。本文定量地度量了列向量f与各部分Pi之间的相似度值S(f↔Pi),然后根据相似度值S(f↔Pi)将列向量f采样到Pi部分,由式表示为:
在这里插入图片描述
通过采样操作来更新每个part,那么“已经测量的”相似性不再存在,通过不断迭代地进行“相似性度量”→“采样”过程,直到收敛。将下图的refined part pooling代替原框架图的这一部分。
2017 ECCV之ReID:Beyond Part Models Person Retrieval with Refined Part Pooling (PCB)_第4张图片
RPP不是度量每个f和每个Pi之间的相似性,而是使用部分分类器来预测S(f合Pi)的值(也可以解释为f属于Pi的概率)如下:
在这里插入图片描述
实验
数据集:Market-1501, DukeMTMC- reID, and CUHK03
与其他结构比较:
在这里插入图片描述
消融实验:
PAR学会专注于几个部分,以注意机制区分人。
IDE,学习了全局描述符。
RPP (w/o诱导)是指对精细部分的学习没有诱导,网络通过注意机制学习集中在几个部分上。
2017 ECCV之ReID:Beyond Part Models Person Retrieval with Refined Part Pooling (PCB)_第5张图片
总结
本文提出的PCB框架和RPP是截止目前使用最多的图像分块算法,本文的核心是将feature map按照列向量分part,通过softmax预测不同part的标识,单是由于不同part不可能将人的不同部分包括完全,也就是内部的不一致性,所以本文提出的RPP解决这一问,计算列向量与内部各部分之间的相似度值,通过不断的迭代直至收敛,得到经过refine的part。

你可能感兴趣的:(ReID,单模态)