-
【YOLOP 解读】基于YOLO改进的全景驾驶感知网络,可同时处理三大视觉任务! ⭐️⭐️
- Abstract: YOLOP基于YOLO改进的全景驾驶感知网络,可同时处理三大视觉任务!
- Paper: YOLOP: You Only Look Once for Panoptic Driving Perception
- Code: https://github.com/hustvl/YOLOP
- Tips: 我们提出了一个高效的多任务网络,可以共同处理自动驾驶中的三个关键任务:物体检测、可行驶区域分割和车道检测,以节省计算成本,减少推理时间以提高每项任务的性能。
-
CVPR 2022 | 清华&字节提出FGD:针对目标检测的重点与全局知识蒸馏 ⭐️⭐️
- Abstract: 清华&字节提出FGD:针对目标检测的重点与全局知识蒸馏
- Paper: Focal and Global Knowledge Distillation for Detectors
- Code: https://github.com/yzd-v/FGD
- Tips: FGD仅需要获取学生与教师的特征图,便可完成重点蒸馏损失与全局蒸馏损失的计算,可以很方便的应用到各种类型的检测器上。
-
CVPR 2022 | 南大&腾出提出ST++: 半监督语义分割中更优的自训练范式 ⭐️⭐️
- Abstract: 南大&腾出提出ST++: 半监督语义分割中更优的自训练范式
- Paper: ST++: Make Self-training Work Better for Semi-supervised Semantic Segmentation
- Code: https://github.com/LiheYoung/ST-PlusPlus
- Tips: 本文提出了两个关键的改进策略,分别是在无标签图像上注入强数据增广和基于图像级别选择的渐进式重训练策略。结合了上述改进策略后,传统的self-traininig范式可以同时享有entropy minimization和consistency regularization的优点,并且可以取得优于最新的采用端到端训练的方法的结果。
-
AAAI2022 | SITVOS: 探索transformer在VOS中的隐式目标表征和信息传播 ⭐️⭐️
- Abstract: SITVOS: 探索transformer在VOS中的隐式目标表征和信息传播
- Paper: Siamese Network with Interactive Transformer for Video Object Segmentation
- Tips: 在这篇论文中,我们为SVOS任务构建了一个基于孪生网络的高效架构,并设计了交互式transformer来实现目标表征的隐式增强和目标信息传递,从而完成对整个视频序列指定目标的分割。
-
CVPR 2022 | CNN自监督预训练新SOTA:上交、Mila、字节联合提出具有层级结构的图像表征自学习新框架 ⭐️⭐️
- Abstract: CNN自监督预训练新SOTA:上交、Mila、字节联合提出具有层级结构的图像表征自学习新框架
- Paper: HCSC: Hierarchical Contrastive Selective Coding
- Code: https://github.com/gyfastas/HCSC
- Tips: 这一框架通过将图像表征进行层级聚类,构造具有层级结构的原型向量 (hierarhcical prototypes),并通过这些原型向量选择更加符合语义结构的负样本进行对比学习,由此将层级化的语义信息融入到图像表征中。
-
新突破!华为诺亚开源首个亿级中文多模态数据集-悟空! ⭐️⭐️
- Abstract: 华为诺亚开源首个亿级中文多模态数据集-悟空!
- Paper: Wukong: 100 Million Large-scale Chinese Cross-modal Pre-training Dataset and A Foundation Framework
- Dataset:
- Tips: 除了发布大型中文跨模态数据集悟空以外,还进一步发布了一组使用不同架构(ResNet/ViT/SwinT)和不同方法(CLIP、FILIP 和 LiT)大型预训练模型。