第九周学习周报20181105-20181111

一、回顾之前看多的两篇论文
1.《A Discriminatively Learned CNN Embedding for Person Re-identification》
1)Motivation
现在主流的两种re-ID卷积网络: verification model、 identification model
verification model的缺点:只利用了弱re-ID标签,没有考虑图像对以及其他图像之间的关系
identification model的缺点:训练目标与最后的测试目标不符合,没有考虑图像对之间的相似度度量

2)Contribution
提出了siamese network结合了identification loss与verification loss
这种网络可以同时学习到discriminative embedding与similarity measurement
在大型数据集上与得到了与SOTA相当的准确率

2.《Person Re-identification with Metric Learning using Privileged Information》
1)现有方法的局限
比较 具有全局阈值的 一对相似/不相似实例 之间的距离
这种基于全局阈值的两两约束在处理 复杂的类间和类内变量的实际任务时 可能会出现学习性能不佳的问题。
减轻这种限制的一个解决方案:设计局部自适应决策规则

2)本文提出的方法:Logistic Discriminant Metric Learning
LDML+ 、MVLDML(multi-view)
通过利用辅助信息构造局部自适应决策函数来学习PSD度量,该决策函数具有更强的鲁棒性和更好的性能
每个训练实例都以两种特征形式表示: 来自原始空间 + 来自特权空间
在训练过程中,特权空间中的距离作为一个局部决策阈值,引导原空间的度量学习
有效的迭代优化算法来同时优化度量和度量的权重

privileged information
只在训练期间使用
通常描述训练实例的一些重要属性,如:属性、标记、文本描述或其他高级知识等

1.LDML+(single-view)
只考虑一个原始特征
共同学习两个距离度量:原始特征空间的M、特权空间的P
通过PSD约束,最小化经验损失来惩罚原空间距离和特权空间距离的差值
在训练过程中设计局部自适应决策规则
全局阈值被特权空间中的平方距离所取代

2.MVLDML+(multi-view)
在同一特权知识的指导下,从不同的原始特征空间中同时学习多个M
学习多个度量:原始空间的多个M、特权空间的一个P
MVLDML+可以通过利用更多的视觉特性来获得更好的性能

3.采用交替优化策略来解决Eq.(10)中的最小化问题
即:交替更新Mm(m = 1,···,m), P, a来优化目标

二、看了一篇新的论文
《Learning View-Specific Deep Networks for Person Re-Identification》
1.传统新人重识别的不足
1)当不相交的角度之间出现外观上的显著变化,角度通用特性不适用于解决re-id的问题
2)对所有角度使用共享模型会忽略不同角度之间的差异

2.本论文提出的新人重识别框架
1)不同于传统的深度模型,因为它学习不同的深度网络以适应不同的角度
2)将CV-EC集成到框架中,,以对齐不同角度的深层特征
3)引入CV-CL来缩小不同角度之间的特征差异
4)使用CV-EC和CV-CL迭代更新view-specific network的参数
5)最后,论文将CV-EC和CV-CL扩展到多角度版本

3.总结
本文提出了一种逻辑判别度量学习方法。它利用特权信息构建一个局部自适应决策规则,可以很好地处理复杂的类间和类内变量。并将该方法扩展到多视图设置,有效地探索了多种不同视觉表示的互补。此外,还引入了一种有效的迭代优化策略来求解该方法。对多重挑战性数据进行了广泛的实验评估和分析。

创新点
1)新的框架: (ICV-ECCL)
Iterative Cross-View Euclidean Constraint and Center Loss

2)第一次,通过使用深度网络来提取特定角度的特征

三、LUPI paradigm
Vapnik等人首次以支持向量机+的形式引入支持向量机的一种新的学习范式。
使用额外的(特权)信息作为预测松弛变量的代理。相当于学习一个预言,它告诉我们哪个样本容易预测,哪个样本很难预测。
该范式用于哈希、动作和事件识别、信息瓶颈学习、学习排序、图像分类、目标定位、主动学习等。

你可能感兴趣的:(学习周报,学习周报)