-
CVPR 2022 | FAIR提出MaskFeat:自监督视觉预训练新方法!灵感之一来自16年前CVPR论文 ⭐️⭐️
- Abstract: FAIR提出MaskFeat:自监督视觉预训练新方法!
- Paper: Masked Feature Prediction for Self-Supervised Visual Pre-Training
- Tips: MaskFeat最核心的改变就是将MAE对图像像素(pixel)的直接预测,替换成对图像的方向梯度直方图(HOG)的预测。
-
GAN掉人脸识别系统?GAN模型「女扮男装」 ⭐️⭐️
- Abstract: GAN掉人脸识别系统?GAN模型「女扮男装」
- Paper: Face Verification Bypass
- Tips: 用对抗生成网络GAN生成一个面部图像来模仿目标人脸,看看人脸识别系统能否正确验证。因为人脸的关键特征信息都保留了下来,所以论文的结果显示,生成的人脸图像仍然可以通过人脸验证。
-
CVPR 2022 | TCTrack: 用于空中跟踪的时序信息框架 ⭐️⭐️
- Abstract: TCTrack: 用于空中跟踪的时序信息框架
- Paper: TCTrack: Temporal Contexts for Aerial Tracking
- Code: https://github.com/vision4robotics/TCTrack
- Tips: TCTrack通过特征维度及相似度图维度连续整合时序信息。在特征提取过程中,作者通过使用改进的Online TAdaConv在特征维度高效引入时序信息;而在特征图维度,本文使用了更加高效的时序信息策略,通过不断积累的时序信息修正特征图。
-
CVPR 2022 | 清华开源DAT:具有可变形注意力的视觉Transformer ⭐️⭐️
- Abstract: 清华开源DAT:具有可变形注意力的视觉Transformer
- Code: Vision Transformer with Deformable Attention
- Code: https://github.com/LeapLabTHU/DAT
- Tips: 本文提出了一种新的可变形的自注意力模块,该模块以数据依赖的方式选择了自注意力中的key和value对的位置。这种灵活的方案使自注意力模块能够聚焦于相关区域并捕获更多信息。在此基础上,提出了一种可变形注意力Transformer(Deformable Attention Transformer)模型,该模型具有可变形注意力,适用于图像分类和密集预测任务。
-
新加坡国立大学&哈工大提出《Incremental-DETR》,基于自监督学习的增量 Few-Shot 目标检测,性能SOTA! ⭐️⭐️
- Abstract: 新加坡国立大学&哈工大提出《Incremental-DETR》,基于自监督学习的增量 Few-Shot 目标检测
- Paper: Incremental-DETR: Incremental Few-Shot Object Detection via Self-Supervised Learning
- Tips: 在本文中,作者提出了一种新的增量few-shot目标检测框架:针对更具挑战性和现实性的场景,在训练数据集中没有来自基类的样本,只有来自新类的少量样本。作者提出使用两阶段微调策略和自监督学习来保留基类的知识,并学习更好的泛化表示。然后,作者利用知识提取策略,使用新类中的少量样本,将知识从基础转移到新模型。
-
大规模模型训练tricks集锦 ⭐️⭐️
- Abstract: 大规模模型训练tricks集锦
- Tips: 大规模模型训练其实就是在和计算、存储和通信玩的过程,所以作者列一下跟这些相关的文章。