《跟李沐读论文》之对比学习

方法

  • 第一阶段
    • InstDisc:个体判别的代理任务
    • InvaSpread:个体判别代理
    • 3.CPC:生成式任务
    • 4.CMC:多视角
  • 第二阶段
    • 5.MoCo: 可以看作InstDisc的升级
    • 6.SimClear:InvaSpread的进阶
    • 7.MoCo V2:
    • 8.SimClear V2
    • 9.SwAV
  • 第三阶段:不用负样本
    • BYOL
    • SimSiam
  • 第四阶段:transformer

第一阶段

InstDisc:个体判别的代理任务

将单个图像看作一个类别,与自身看作相同类,与其他图像看作不同类。
《跟李沐读论文》之对比学习_第1张图片
方法:使用一个memory bank存储大量的负样本。损失函数:NCELoss
《跟李沐读论文》之对比学习_第2张图片

InvaSpread:个体判别代理

《跟李沐读论文》之对比学习_第3张图片
同类靠近,不同类扩散开
《跟李沐读论文》之对比学习_第4张图片
负样本在同一个batch内。损失仍然是NCELoss的变体。

3.CPC:生成式任务

《跟李沐读论文》之对比学习_第5张图片

4.CMC:多视角

《跟李沐读论文》之对比学习_第6张图片
人类能够识别不同视角下的对象,比如灰度图,深度图,分割图。同一张图片不同视角靠的近,不同的图片靠的远。
局限性:不同视角需要不同的编码器,可以通过transformer改进。

第二阶段

5.MoCo: 可以看作InstDisc的升级

《跟李沐读论文》之对比学习_第7张图片
查找字典的过程:队列;动量更新

6.SimClear:InvaSpread的进阶

《跟李沐读论文》之对比学习_第8张图片
g()只是一个MLP层,但提点明显。改进点:更多的数据增强;g(()函数,更大的batchsize

7.MoCo V2:

将simclear的trick加入MOCO中,

8.SimClear V2

《跟李沐读论文》之对比学习_第9张图片
三个点:更强的骨干;MLP更深;动量更新

9.SwAV

《跟李沐读论文》之对比学习_第10张图片
使用聚类,交叉预测 。multi-crop(多视角加分,全局和局部视角都关注)

第三阶段:不用负样本

BYOL

SimSiam

第四阶段:transformer

你可能感兴趣的:(对比学习)