-
CVPR 2022|基于GAN逆映射的高保真图像编辑算法 by 港科大&腾讯AI Lab开源 ⭐️⭐️
- Abstract: 基于GAN逆映射的高保真图像编辑算法
- Paper: High-Fidelity GAN Inversion for Image Attribute Editing
- Code: https://github.com/Tengfei-Wang/HFGI
- Tips: 本文提出了一种名为信息参照(information consultation)的方法,同时利用low-rate和high-rate隐编码。该模型包括两个编码器,基础编码器压缩低率隐编码,用于保证图像的可编辑性;参照编码器对低率重建图像的失真信息进行补充编码,得到一个高率的隐编码,补充丢失的细节信息。
-
CVPR 2022 | 华南理工提出VISTA:双跨视角空间注意力机制实现3D目标检测SOTA,即插即用 ⭐️⭐️
- Abstract: 华南理工提出VISTA:双跨视角空间注意力机制实现3D目标检测SOTA,即插即用
- Paper: VISTA: Boosting 3D Object Detection via Dual Cross-VIew SpaTial Attention
- Code: https://github.com/Gorilla-Lab-SCUT/VISTA
- Tips: 本文提出了 VISTA,一种新颖的即插即用多视角融合策略,用于准确的 3D 对象检测。为了使 VISTA 能够关注特定目标而不是一般点,研究者提出限制学习的注意力权重的方差。将分类和回归任务解耦以处理不平衡训练问题。
-
CVPR 2022|Adobe提出InsetGAN! 全身都生成,这可太GAN了 ⭐️⭐️
- Abstract: Adobe提出InsetGAN! 全身都生成,这可太GAN了
- Paper: InsetGAN for Full-Body Image Generation
- Tips: 他们首先引入了一个边界框检测器,检测部分GAN生成的特定区域在底层画布,也就是全身GAN生成的区域中的位置,经过裁剪后再将特定区域嵌入。
-
Swim-Transform V2:用于目标检测,视觉大模型不再是难题(附源代码) ⭐️⭐️
- Abstract: Swim-Transform V2:用于目标检测,视觉大模型不再是难题(附源代码)
- Paper: Swin Transformer V2: Scaling Up Capacity and Resolution
- Code: https://github.com/microsoft/Swin-Transformer
- Tips: MSRA时隔大半年放出了Swin Transformer 2.0版本,在1.0版本的基础上做了改动,使得模型规模更大并且能适配不同分辨率的图片和不同尺寸的窗口!这也证实了,Transformer将是视觉领域的研究趋势!
-
CVPR 2022 | 天大本科生论文入选!深度学习长尾分类新SOTA ⭐️⭐️
- Abstract: 深度学习长尾分类新SOTA
- Paper: Trustworthy Long-Tailed Classification
- Tips: 通过引入不确定性集成,来实现对尾部类别样本的自动感知。在此基础上,提出为尾部类别样本动态分配比头部样本更多的模型资源(experts),以兼顾性能与效率。
-
刷新4个SOTA!港大&字节开源ReferFormer: 语言作为查询的视频目标分割框架 ⭐️⭐️
- Abstract: 港大&字节开源ReferFormer: 语言作为查询的视频目标分割框架
- Paper: Language as Queries for Referring Video Object Segmentation
- Code: https://github.com/wjn922/ReferFormer
- Tips: 研究者们提出了一种基于Transformer的参考视频目标分割新框架ReferFormer。其将语言描述视为查询条件,直接在视频中查找目标对象,除此之外,通过实例序列的整体输出自然地完成目标物体的跟踪,无需进行任何后处理。