论文阅读(九)Attention-Aware Compositional Network for Person Re-identification

论文阅读(九)Attention-Aware Compositional Network for Person Re-identification_第1张图片

Abstract

作者提出,姿态信息没有被好好的利用到行人再识别中,于是提出了Attention-Aware Compositional Network (AACN)模型。AACN包含两部分:(1)Pose-guided Part Attention (PPA),通过学习掩盖背景部分。(2)Attention-aware Feature Composition (AFC),通过pose-guided visibility scores估计身体哪部分被遮挡。

论文阅读(九)Attention-Aware Compositional Network for Person Re-identification_第2张图片

1. Introduction

Pose-guided Part Attention(PPA)是一个置信图,可以精确捕捉目标区域同时去除背景区域。将这置信图当作一种掩模,应用在特征图上,那么AFC部分就可以提取出局部区域对齐的特征。

本文贡献:

1、提出AACN模型处理错位与遮挡问题

2、使用PPA预测局部区域,去除背景干扰。

3、引入可见性分数 (visibility scores)来测量每个身体部位的遮挡程度,他为注意力感知特征组合(Attention-aware Feature
Composition.)提供了图像特定区域的重要性分数

4、在数据集上的多个实验

论文阅读(九)Attention-Aware Compositional Network for Person Re-identification_第3张图片

Attention-Aware Compositional Network

AACN包含两部分PPA与AFC。

PPA是一个两阶段三分支的模块,生成关键点置信图,刚性区域与非刚性区域的attention maps。根据局部区域attention maps进一步预测visibility scores。

AFC分为三个阶段,第一阶段使用GoogleNet生成全局特征。第二阶段,依赖PPA生成的局部区域attention map,用attention map去掩盖全局特征,接着第三阶段再与visibility score加权融合,最终生成一个1024维的向量。

Pose-guided Part Attention

论文阅读(九)Attention-Aware Compositional Network for Person Re-identification_第4张图片

受multi-stage CNN人体姿态估计的启发,PPA采用两阶段设计,第一阶段分别预测非刚性区域attention N 与刚性区域attention R与关键点置信图K。第二阶段微调attention maps。

attention map中的强度表示区域的可见性,可以获得visibility score。

Attention-aware Feature Composition

AFC包含三个阶段,Global Context Network (GCN), Attention-Aware Feature Alignment, and Weighted Feature Composition。

第一阶段使用GoogleNet提取全局特征。

第二阶段基于第一阶段的全局特征,并结合PPA的attention map来生成part-attention-aware features。

第三阶段使用visibility score加权融合第二阶段的features,可见区域权重大。

 

 

 

 

 

 

 

 

 

 

你可能感兴趣的:(论文阅读)