论文crowd counting using scale-aware attention networks阅读笔记

论文地址: https://arxiv.org/pdf/1903.02025.pdf

代码:暂时没找到

创新点:

1。多分支尺度感知注意网络

2。尺度感知的注意力机制

3、尺度感知的loss

4.新的方法估计图片中人头尺寸

摘要

论文提出了一种新的尺度感知注意网络来解决图像中的尺度变化问题。基于最近流行的attention 机制,论文提出的网络能够自动聚焦于某些局部和全局尺度,论文提出的方法在某些数据集上优于其他方法。

 

一、简介

二、相关工作

三、我们的方法

人群密度会随着图像的不同而剧烈变化,即使在同一张图片内,随着空间位置不同,密度图变化也很剧烈。我们建议同时使用全局和局部注意权重来捕捉人群密度在图像间和图像内的变化。

3.2 全局尺度注意

   作者采用了一个全局尺度attention(GSA)模型来获图片的稠密度的全局上下文信息,这个模型利用图片作为输入,可以得出3个attention 得分,每个得分对应于预定义三个密度值中的一个:低密度,中密度,高密度。在多尺度特征提取模块中,密度级的数量等于尺度的数量。

GSA对每个输入图像输出三个预测值g_i,代表

3、4  网络融合

  记f_i\in R^{H_i\times w_i\times D_i}(i=1,2,3)代表3个不同尺度的特征图,H_i\times W_i代表空间维度,D_i代表第i个特征图的通道数。我们用g_i \in R(i=1,2,3),l_i\in R^{H_i\times W_i}(i=1,2,3)分别代表相应的全局与局部注意得分,他们可以被用来重新加权特征图。记

尺度感知的loss:

简单来讲,每一层的密度图估计一定大小范围内的人头。将这个范围内的人头看作GI,其他不符合大小的人头看作背景。本质上是尺度感知的欧式距离。

 

 

你可能感兴趣的:(论文crowd counting using scale-aware attention networks阅读笔记)