CVPR 2022 优质论文分享

CVPR 2022 优质论文分享

A ConvNet for the 2020s

论文:https://arxiv.org/abs/2201.0354

代码:https://github.com/facebookresearch/ConvNeXt

CVPR 2022 优质论文分享_第1张图片

2020年以来,ViT一直是研究热点。ViT在图片分类上的性能超过卷积网络的性能,后续发展而来的各种变体将ViT发扬光大(如Swin-T,CSwin-T等),值得一提的是Swin-T中的滑窗操作类似于卷积操作,降低了运算复杂度,使得ViT可以被用做其他视觉任务的骨干网络,ViT变得更火了。本文探究卷积网络到底输在了哪里,卷积网络的极限在哪里。在本文中,作者逐渐向ResNet中增加结构(或使用trick)来提升卷积模型性能,最终将ImageNet top-1刷到了87.8%。作者认为本文所提出的网络结构是新一代(2020年代)的卷积网络(ConvNeXt),因此将文章命名为“2020年代的卷积网络”。

Incremental Transformer Structure Enhanced Image Inpainting with Masking Positional Encoding

论文:https://arxiv.org/abs/2203.00867

代码:https://github.com/DQiaole/ZITS_inpainting

CVPR 2022 优质论文分享_第2张图片

近年来,图像修复取得了重大进展。然而,恢复具有生动纹理和合理结构的损坏图像仍然具有挑战性。由于卷积神经网络 (CNN) 的感受野有限,一些特定的方法只能处理常规纹理,而会丢失整体结构。另一方面,基于注意力的模型可以更好地学习结构恢复的远程依赖性,但它们受到大图像尺寸推理的大量计算的限制。为了解决这些问题,本文建议利用额外的结构恢复器来逐步促进图像修复。所提出的模型在固定的低分辨率草图空间中使用强大的基于注意力的 Transformer 模型来恢复整体图像结构。

Class Re-Activation Maps for Weakly-Supervised Semantic Segmentation

论文:https://arxiv.org/pdf/2203.00962.pdf

代码:https://github.com/zhaozhengChen/ReCAM

CVPR 2022 优质论文分享_第3张图片

本文介绍了一种非常简单高效的方法:使用名为 ReCAM 的 softmax 交叉熵损失 (SCE) 重新激活具有 BCE 的收敛 CAM。给定一张图像,本文使用 CAM 提取每个类的特征像素,并使用它们与类标签一起使用 SCE 学习另一个全连接层(在主干之后)。收敛后,本文以与 CAM 中相同的方式提取 ReCAM。由于 SCE 的对比性质,像素响应被分解为不同的类别,因此预期的掩码模糊性会更小。对 PASCAL VOC 和 MS COCO 的评估表明,ReCAM 不仅可以生成高质量的遮罩,还可以在任何 CAM 变体中以很少的开销支持即插即用。

CVPR 2022 优质论文分享_第4张图片

你可能感兴趣的:(深度学习,神经网络,人工智能)