论文下载:https://arxiv.org/pdf/1812.03282.pdf
读前需掌握的知识:
Parzen window概率密度估计:Parzen窗方法 - 知乎
拉普拉斯平滑:理解朴素贝叶斯分类的拉普拉斯平滑 - 知乎
文章主架构
分三部分:上半部蓝色的视觉特征流,下半部分绿色时空流,和右边的联合度量。
通过PCB网络获取两个特征向量,并计算余弦距离:
我们首先估计时空直方图,然后使用Parzen窗口方法对其进行平滑。
对于两张图像,有以下定义:
k表示第k个直方图的bin,有多少个bin即表示把直方图划分成多少个区域。
表示在 第k个直方图bin上,有多少个图像对的时间差在这个bin的范围内。y=1表示图像对 i 和 j 是相同身份,y=0则表示不同身份。
----------------------------------------------------------------------------------割------------------------------------------
然后,
再使用‘Parzen Window method’对直方图进行平滑(smooth),
K(.)是一个kernel,这里使用gaussian function。
Z是一个归一化因子。
----------------------------------------------------割-----------------------------------------------------------------
简单的可以认为 ,视觉流和时空流互不相关,直接相乘。即
但是忽略了两个点:
(1)直接使用视觉相似得分,作为概率计算并不合理。即:
(2)时空概率是不可靠和无法控制的,因为一个人的行走轨迹和速度是不确定的。直接使用
作为时空概率函数,在保持精度的同时会导致低召回率。例如:
因此为了解决上述,提出两个Observation
1.Observation 1: Laplace smoothing拉普拉斯平滑,广泛运用于朴素贝叶斯先验概率的技术
公式6:其中dk表示第k个类别的标签,mk表示第k个类别的总数,M表示全样本数量,D表示类别数量,λ表示平滑参数。
公式7:特殊的,取D=2 ,λ=1
拉普拉斯平滑的作用:用来调整罕见事件的概率值,将概率值收缩到 mk/M ~ 1/2之间
2.Observation 2: Logistic function:常用与二元分类
特别的此处定义为
λ是平滑因子,γ是收缩因子,两个都是常数变量。
最终概率使用以下公式:
其中s(xi,xj)经过logistic function f()进行收缩,but not so much。因为视觉得分相对可靠。
Pst经过拉普拉斯平滑,进行了截断和上升,即使的Pst接近于0 ,