Siamese Neural Network (SNN: 孪生神经网络)

0. 概述

  • GLA:Generalized Linear Assignment (通用线性分配)

1. 用途

  • 衡量两个输入的相似程度
  • 孪生神经网络有两个输入(Input1 and Input2),将两个输入feed进入两个神经网络(Network1 and Network2),这两个神经网络分别将输入映射到新的空间,形成输入在新的空间中的表示。通过Loss的计算,评价两个输入的相似度。Siamese Neural Network (SNN: 孪生神经网络)_第1张图片

2. SNN网络结构

Siamese Neural Network (SNN: 孪生神经网络)_第2张图片

  • Network1和Network2是同一个网络,且它们的权值都一样。

3. PSNN网络结构

  • PSNN:Pseudo-Siamese Neural Network (伪孪生神经网络 )
    Siamese Neural Network (SNN: 孪生神经网络)_第3张图片
  • 其Netowrk1和Network2可以是不同的神经网络(如:左边是LSTM,右边是CNN),也可是相同类型的神经网络
  • 其权值不共享

4. 孪生神经网络和伪孪生神经网络的区别

  • 孪生神经网络用于处理两个输入"比较类似"的情况。
  • 伪孪生神经网络适用于处理两个输入"有一定差别"的情况。
  • 如:我们要计算两个句子或者词汇的语义相似度,使用siamese network比较适合;如果验证标题与正文的描述是否一致(标题和正文长度差别很大),或者文字是否描述了一幅图片(一个是图片,一个是文字),就应该使用pseudo-siamese network。也就是说,要根据具体的应用,判断应该使用哪一种结构,哪一种Loss

5. SNN损失函数

  • Softmax当然是一种好的选择,但不一定是最优选择,即使是在分类问题中。传统的siamese network使用Contrastive Loss。
  • 损失函数还有更多的选择,siamese network的初衷是计算两个输入的相似度,。左右两个神经网络分别将输入转换成一个"向量",在新的空间中,通过判断cosine距离就能得到相似度了。
  • Cosine是一个选择,exp function也是一种选择,欧式距离什么的都可以,训练的目标是让两个相似的输入距离尽可能的小,两个不同类别的输入距离尽可能的大。
  • 根据实验分析,cosine更适用于词汇级别的语义相似度度量,而exp更适用于句子级别、段落级别的文本相似性度量。其中的原因可能是cosine仅仅计算两个向量的夹角,exp还能够保存两个向量的长度信息,而句子蕴含更多的信息。

6. 轨迹关连

Siamese Neural Network (SNN: 孪生神经网络)_第4张图片

你可能感兴趣的:(MOT,神经网络,深度学习,机器学习)