论文笔记:Spatial-Temporal Person Re-identification 时空行人重识别

论文下载:https://arxiv.org/pdf/1812.03282.pdf

 读前需掌握的知识:

Parzen window概率密度估计:Parzen窗方法 - 知乎

拉普拉斯平滑:理解朴素贝叶斯分类的拉普拉斯平滑 - 知乎

文章主架构

论文笔记:Spatial-Temporal Person Re-identification 时空行人重识别_第1张图片分三部分:上半部蓝色的视觉特征流,下半部分绿色时空流,和右边的联合度量。

视觉特征流:

通过PCB网络获取两个特征向量,并计算余弦距离:

论文笔记:Spatial-Temporal Person Re-identification 时空行人重识别_第2张图片

 时空流:

我们首先估计时空直方图,然后使用Parzen窗口方法对其进行平滑。

对于两张图像,有以下定义:

论文笔记:Spatial-Temporal Person Re-identification 时空行人重识别_第3张图片

 分别表示label、相机、时间

k表示第k个直方图的bin,有多少个bin即表示把直方图划分成多少个区域。

表示时间差在第K个bin的数值区间上。 

表示在 第k个直方图bin上,有多少个图像对的时间差在这个bin的范围内。y=1表示图像对 i 和 j 是相同身份,y=0则表示不同身份。

文中没提,大概是全部值累加。 

----------------------------------------------------------------------------------割------------------------------------------

然后,

再使用‘Parzen Window method’对直方图进行平滑(smooth),

论文笔记:Spatial-Temporal Person Re-identification 时空行人重识别_第4张图片

 论文笔记:Spatial-Temporal Person Re-identification 时空行人重识别_第5张图片

 K(.)是一个kernel,这里使用gaussian function。

Z是一个归一化因子。

----------------------------------------------------割-----------------------------------------------------------------

联合部分(Joint Metric):

简单的可以认为  ,视觉流和时空流互不相关,直接相乘。即

 但是忽略了两个点:

(1)直接使用视觉相似得分,作为概率计算并不合理。即:

(2)时空概率是不可靠和无法控制的,因为一个人的行走轨迹和速度是不确定的。直接使用

 作为时空概率函数,在保持精度的同时会导致低召回率。例如:

论文笔记:Spatial-Temporal Person Re-identification 时空行人重识别_第6张图片

 因此为了解决上述,提出两个Observation

1.Observation 1: Laplace smoothing拉普拉斯平滑,广泛运用于朴素贝叶斯先验概率的技术

论文笔记:Spatial-Temporal Person Re-identification 时空行人重识别_第7张图片

 公式6:其中dk表示第k个类别的标签,mk表示第k个类别的总数,M表示全样本数量,D表示类别数量,λ表示平滑参数。

公式7:特殊的,取D=2 ,λ=1

拉普拉斯平滑的作用:用来调整罕见事件的概率值,将概率值收缩到 mk/M ~ 1/2之间

2.Observation 2: Logistic function:常用与二元分类

        特别的此处定义为

论文笔记:Spatial-Temporal Person Re-identification 时空行人重识别_第8张图片

 λ是平滑因子,γ是收缩因子,两个都是常数变量。

联合度量:

最终概率使用以下公式:

论文笔记:Spatial-Temporal Person Re-identification 时空行人重识别_第9张图片

 其中s(xi,xj)经过logistic function f()进行收缩,but not so much。因为视觉得分相对可靠。

Pst经过拉普拉斯平滑,进行了截断和上升,即使的Pst接近于0 ,

 

 

 

 

 

你可能感兴趣的:(re-ID,深度学习,计算机视觉)