CVPR 第51页

以CVPR顶会论文为例，探讨AI论文的阅读方法

作为一个科研工作者，每天必做的事情就是阅读论文进行输入，但是面对海量的文献，如何做到高效输入且不遗漏信息？这个过程中需要我们掌握一些文献阅读技巧。常说文献精读，但是如何去做精读？怎么去理解一篇论文的展开逻辑？作者究竟是怎么表达自己的核心工作？一、为什么要读论文☞阅读论文的重要性①吸收作者的idea：找到论文里的新内容其实阅读论文的过程就是我们吸收作者idea的过程，我们首先得先知道现有的研究是什么

沃恩智慧·2022-12-10 12:02

自动矢量化步骤_自动驾驶还是要看Waymo----CVPR2020

转自公众号：计算机视觉之路原文链接：头条|自动驾驶还是要看Waymo----CVPR2020mp.weixin.qq.comWaymo在CVPR2020做了一个题目为：MachineLearningforAutonomousDrivingatScale

世界上最后一只猫·2022-12-10 07:22

CVPR2021论文速览--LaPred: Lane-Aware Prediction of Multi-Modal Future Trajectories of Dynamic Agents

LaPred：动态代理多模态未来轨迹的车道感知预测原文链接：LaPred:Lane-AwarePredictionofMulti-ModalFutureTrajectoriesofDynamicAgents(thecvf.com)研究背景DNN模型中间逻辑可解释性差；交互感知预测：需要人为设计坐标系统和张量分辨率；场景上下文感知预测：通过轨迹数据推断二维图像上绘制的车道关系难度高；研究问题预测问题

UnicornH!XD·2022-12-10 07:19

#今日论文推荐# CVPR2022|比VinVL快一万倍，人大提出交互协同的双流视觉语言预训练模型COTS，又快又好

wwwsxn·2022-12-10 04:20

文献翻译和笔记--Cross-Modal Contrastive Learning for Text-to-Image Generation(用于文本到图像生成的跨模态对比学习)

CVPR2021文献下载：CVPR2021OpenAccessRepository摘要文本到图像合成系统的输出应该是连贯、清晰、逼真的场景，对其条件文本描述具有高度的语义保真度。

MT_Joy·2022-12-10 04:43

最优传输论文（六十三）：Contrastive Adaptation Network for Unsupervised Domain Adaptation论文原理

OptimizingCAN4.Experiments4.1.Setups4.2.Comparisonwiththestate-of-the-art4.3.消融研究5.Conclusion代码前言文章来自2019年的CVPR

CtrlZ1·2022-12-10 04:12

3D人体姿态估计笔记

估计人的关节点坐标（回归问题）RGBorRGBD图像or视频单目or多视角单人or多人2Dor3D3D姿态or3D形态2D姿态估计任务单人姿态估计Benchmark:MPII(2014)代表作:CPM(CVPR2016

小白学视觉·2022-12-10 03:09

深度学习(10):PointNet论文翻译与学习

分类和分割的点集的深度学习PointNet:DeepLearningonPointSetsfor3DClassificationandSegmentation作者：注：两个原因对我而言阅读难度大：（1）CVPR

biter0088·2022-12-10 02:50

顶会查找论文的网址和检索方法

顶会的论文集：https://openaccess.thecvf.com/menu包含：CVPR2020/2021/2022WACV2020/2021/2022ICCV2013/2015/2017/2019

hhh-g·2022-12-10 01:57

MuKEA: Multimodal Knowledge Extraction and Accumulation for Knowledge-based VQA 论文阅读 From CVPR 2022

MuKEA：基于视觉问答（VQA）的多模态知识抽取与积累论文下载：https://arxiv.org/abs/2203.09138github代码：https://github.com/AndersonStra/MuKEA一、研究背景结合外部知识的VQA任务(KnowledgebasedVQA)需要AI能够利用到超出输入图像、问题之外的额外知识。近年来，尽管一些KB-VQA的方法取得了一定成果，但

八个牙履·2022-12-10 01:56

阿里达摩院提出MogFace：人脸检测新工作 | CVPR 2022

微信技术交流群一、开源MogFace:TowardsaDeeperAppreciationonFaceDetection1.论文链接：https://openaccess.thecvf.com/content/CVPR2022

Amusi（CVer）·2022-12-10 00:30

目标检测ReXnet:Rethinking Channel Dimensions for Efficient Model Design

摘要cvpr2021作者从特征矩阵秩的角度来改进，提出了关于卷积通道设置的一些限制要求。

Diros1g·2022-12-09 23:53

动作识别最新高效利器 ACTION-Net：通用的多路径激活模块 | CVPR 2021

2021-04-2001:48:02本文是对我们CVPR2021接收的工作"ACTION-Net:MultipathExcitationforActionRecognition"的介绍。

喜欢打酱油的老鸟·2022-12-09 22:22

[论文阅读] ACTION-Net: Multipath Excitation for Action Recognition

ACTION-Net:MultipathExcitationforActionRecognition单位都柏林圣三一大学、字节跳动会议CVPR2021论文地址arxiv代码地址github摘要时空特征、

BENULL·2022-12-09 22:52

行为识别 - ACTION-Net: Multipath Excitation for Action Recognition

要解决什么问题2.用了什么方法3.效果如何4.还存在什么问题&可借鉴之处0.前言相关资料：arxivgithub论文解读论文基本信息领域：行为识别作者单位：都柏林圣三一大学（爱尔兰的……）&字节发表时间：CVPR2021

清欢守护者·2022-12-09 22:51

论文笔记之ACTION-Net: Multipath Excitation for Action Recognition

CVPR2021论文地址：https://arxiv.org/abs/2103.07372代码地址：https://github.com/V-Sense/ACTION-Net1.总述时空、通道和运动模式是视频动作识别中三种重要的互补信息

To_1_oT·2022-12-09 22:50

CVPR 2021 用于动作识别，即插即用、混合注意力机制的 ACTION 模块ACTION-Net: Multipath Excitation for Action Recognition

CVPR2021|用于动作识别，即插即用、混合注意力机制的ACTION模块分享一篇来自CVPR2021的文章，ACTION-Net:MultipathExcitationforActionRecognition

baidu_huihui·2022-12-09 22:20

DANet：Dual Attention Network for Scene Segmentation论文解读和源代码详解

今天为大家带来一篇CVPR2019的语义分割的一篇文章，我认为也是非常新颖的了。其中的对偶结构生成的attentionmap我认为很容易嵌入到其他网络中完成其他任务。

咆哮的阿杰·2022-12-09 21:35

【论文阅读】DANet（CVPR2019）

论文题目：DualAttentionNetworkforSceneSegmentation论文地址：https://arxiv.org/pdf/1809.02983.pdf代码地址：https://github.com/junfu1115/DANet自注意力讲解：https://blog.csdn.net/qq_37935516/article/details/104123018文章贡献：1.提出

络小绎·2022-12-09 21:35

语义分割系列11-DAnet（pytorch实现）

DAnet：DualAttentionNetworkforSceneSegmentation发布于CVPR2019，本文将进行DAnet的论文讲解和复现工作。

yumaomi·2022-12-09 21:34

源码解读ReDet：A Rotation-equivariant Detector for Aerial Object Detection

文章目录前言1、解决的问题2、模型结构2.1.ReCNN2.2.RiRoiAlign总结前言本篇解读2021CVPR旋转目标检测论文：ReDet:ARotation-equivariantDetectorforAerialObjectDetection

武乐乐~·2022-12-09 20:00

论文阅读：Oriented RepPoints for Aerial Object Detection (CVPR 2022)

2105.11111code:GitHub-LiWentomng/OrientedRepPoints:Thecodefor“OrientedRepPointsforAerialObjectDetection(CVPR2022

不瘦8斤的妥球球饼·2022-12-09 20:29

#今日论文推荐# CVPR 2022 | 浙大提出Oriented RepPoints：旋转目标检测网络

wwwsxn·2022-12-09 20:29

【CVPR 2020】Learning RoI Transformer for Oriented Object Detection in Aerial Images

介绍这篇文章是针对旋转框任务的；摘要由于鸟瞰视角、高度复杂的背景和多变的物体外观，航拍图像中的目标检测是计算机视觉中一项活跃但具有挑战性的任务。许多检测方法依赖于通用目标检测中的水平候选框，而这类方法尤其在航拍图像中检测密集目标时则会引入RoI和目标之间的不匹配。这会导致最终目标分类置信度和定位精度之间常见的错位。在本文中，作者提出一种RoI-Transformer来解决这些问题。RoI-Tran

songyuc·2022-12-09 20:28

【CVPR2022文章翻译】Oriented RepPoints for Aerial Object Detection全文翻译

paper:https://arxiv.org/pdf/2105.11111.pdfOrientedRepPointsforAerialObjectDetectionAbstract1.Introduction2.RelatedWork2.1.OrientedObjectdetection2.2.Non-axisAlignedFeaturesLearning2.3.SamplesAssignmen

刘可乐呀·2022-12-09 20:27

CVPR 2022 | 浙大提出Oriented RepPoints：旋转目标检测网络

点击下方卡片，关注“CVer”公众号AI/CV重磅干货，第一时间送达点击进入—>CV微信技术交流群作者：小海马|已授权转载（源：知乎）编辑：CVerhttps://zhuanlan.zhihu.com/p/511356711一般物体相比，空中目标通常是非轴对准的，具有杂乱的环境。与主流的包围盒方向回归方法不同，本文提出了一种有效的自适应点学习方法，该方法利用自适应点表示，能够捕捉任意方向实例的几何

Amusi（CVer）·2022-12-09 20:56

【论文】ReDet：A Rotation-equivariant Detector for Aerial Object Detection

GitHub-csuhan/ReDet:Officialcodeofthepaper"ReDet:ARotation-equivariantDetectorfyorAerialObjectDetection"(CVPR2021

小李AI飞刀^_^·2022-12-09 20:24

c++连通区域处理种子生成法

连通区域分析（ConnectedComponentAnalysis-Labeling）OpenCV_连通区域分析（ConnectedComponentAnalysis/Labeling）【摘要】本文主要介绍在CVPR

明泽.·2022-12-09 19:00

3D 目标检测阅读笔记

优秀博客：https://blog.csdn.net/weixin_39373480/article/details/103583523DSGN(CVPR2020)一阶段的，基于双目的3D目标检测器；为了弥补

Harrylin、·2022-12-09 15:24

【三维目标检测】Pointpillars（一）

PointPillars是一种基于体素的三维目标检测算法，发表在CVPR2019《PointPillars:FastEncodersforObjectDetectionfromPointClouds》。

Coding的叶子·2022-12-09 15:23

CenterPoint|Center-based 3D Object Detection and Tracking阅读笔记

题目：Center-based3DObjectDetectionandTracking2021CVPR1.摘要+intro作者认为3D世界中的目标不遵循任何特定的方向，anchor-based来表示目标的检测器难以枚举所有方向或将轴对齐的边界框匹配到旋转的目标

Rolandxxx·2022-12-09 15:44

论文阅读笔记 | 三维目标检测——CenterPoint算法

文章目录0.前言1.背景2.准备工作3.网络结构3.1RPN3.2RCNN4.实验结果paper：《Center-based3DObjectDetectionandTracking》（2021CVPR）

Clichong·2022-12-09 15:43

行人重识别 reid-strong-baseline代码运行

作为刚入门的小白，先找了reid方向的一个baseline来学习，我找的是浙江大学罗浩老师在2019发表的一篇CVPR论文，该论文利用一些tricks来提出了一个更强的baseline，本文主要是运行该论文的代码

悦耳de泽冰s·2022-12-09 13:40

【论文笔记】InverseForm: A Loss Function for Structured Boundary-Aware Segmentation

论文标题：InverseForm:ALossFunctionforStructuredBoundary-AwareSegmentation收录于：CVPR2021论文：[2104.02745]InverseForm

m0_61899108·2022-12-09 12:50

CVPR2022 A ConvNet for the 2020s

AConvNetforthe2020shttps://arxiv.org/abs/2201.03545https://github.com/facebookresearch/ConvNeXt讲解https://mp.weixin.qq.com/s/q-s_dV4-TCiVPMOTZKEgPQhttps://www.bilibili.com/video/BV1SS4y157fuhttps://www

菜鸟中的菜中菜·2022-12-09 12:08

CVPR2022|比VinVL快一万倍！人大提出交互协同的双流视觉语言预训练模型COTS，又快又好！

有用的话文末帮忙点个赞哦~【写在前面】大规模的单流预训练在图文检索中表现出显着的性能。遗憾的是，由于注意力层重，它面临着推理效率低的问题。最近，具有高推理效率的CLIP和ALIGN等双流方法也显示出了可观的性能，但是它们只考虑了两个流之间的实例级对齐（因此仍有改进的空间）。为了克服这些限制，作者提出了一种新的协作双流视觉语言预训练模型，称为COTS，用于通过增强跨模态交互来进行图像文本检索。除了通

FightingCV·2022-12-09 11:14

#今日论文推荐# CVPR 2022 | 阿里提出单目深度估计新SOTA方法：NeW CRFs

wwwsxn·2022-12-09 10:14

CVPR 2022 | 阿里提出单目深度估计新SOTA方法：NeW CRFs

点击下方卡片，关注“CVer”公众号AI/CV重磅干货，第一时间送达作者：原力|已授权转载（源：知乎）编辑：CVerhttps://zhuanlan.zhihu.com/p/522214395单目深度估计是从单张RGB图预测场景深度，是一个很具有挑战性的任务。现在做这个任务的方法大都是设计越来越复杂的网络来简单粗暴地回归深度图，但我们采取了一个更具可解释性的路子，就是使用优化方法中的条件随机场（C

Amusi（CVer）·2022-12-09 10:59

CVPR 2022 | NeW CRFs: Neural Window Fully-connected CRFs for Monocular Depth Estimation

CVPR2022|NewCRF：使用Attention模拟了CRF论文：https://arxiv.org/abs/2203.01502代码：https://weihaosky.github.io/newcrfs

有为少年·2022-12-09 10:29

#今日论文推荐#CVPR 2022 | 高保真人头参数化模型HeadNeRF：实时渲染、可直接编辑

wwwsxn·2022-12-09 10:36

CVPR 2022 | 高保真人头参数化模型HeadNeRF：实时渲染、可直接编辑

©作者|中科大张举勇课题组来源|机器之心《黑客帝国:觉醒》演示中的灵魂发问：当我们打造出的世界和我们自己的世界同等真实时，那现实到底意味着什么？还记得去年12月，美国电子游戏与软件开发公司Epic发布的基于自家虚幻5打造的《黑客帝国:觉醒》的演示吗？Demo中所展示的主演人物的毛孔毛发级高真实感建模，着实让人惊叹Epic的强大技术能力。据悉，以上演示Demo中的人物形象是由Epic名下的MetaH

PaperWeekly·2022-12-09 10:28

[论文解析] HeadNeRF: A Realtime NeRF-based Parametric Head Model

blog.csdn.net/c9Yv2cf9I06K2A9E/article/details/124874717来自中科大张举勇教授课题组提出了HeadNeRF，一种基于NeRF的高效全息人脸头部参数化模型，该工作发表于CVPR2022

_Summer tree·2022-12-09 10:51

CVPR22 ｜CMT：CNN和Transformer的高效结合（开源）

作者丨王云鹤@知乎（已授权）来源丨https://zhuanlan.zhihu.com/p/534567826编辑丨极市平台导读到底CNN和Transformer哪个更好？当然是强强联手最好。华为诺亚实验室的研究员提出一种新型视觉网络架构CMT，通过简单的结合传统卷积和Transformer，获得的网络性能优于谷歌提出的EfficientNet，ViT和MSRA的SwinTransformer。摘

Tom Hardy·2022-12-09 08:59

CVPR 2022 | 清华开源DAT：具有可变形注意力的视觉Transformer

点击下方卡片，关注“CVer”公众号AI/CV重磅干货，第一时间送达本文转载自：集智书童点击进入—>CVer微信技术交流群VisionTransformerwithDeformableAttention论文：https://arxiv.org/abs/2201.00520代码：https://github.com/LeapLabTHU/DAT最近，Transformer在各种视觉任务上都表现出了卓

Amusi（CVer）·2022-12-09 08:25

CVPR 2021 | Transformer再下一城！复旦等提出SETR：语义分割网络

点击下方卡片，关注“CVer”公众号AI/CV重磅干货，第一时间送达本文作者：湃森|来源：知乎（已授权）https://zhuanlan.zhihu.com/p/348418189一、论文信息标题：《RethinkingSemanticSegmentationfromaSequence-to-SequencePerspectivewithTransformers》作者：SixiaoZhengeta

Amusi（CVer）·2022-12-09 08:24

Vision Transformer | CVPR 2022 - Vision Transformer with Deformable Attention

CVPR2022-VisionTransformerwithDeformableAttention论文：https://arxiv.org/abs/2201.00520代码：https://github.com

有为少年·2022-12-09 08:22

Global Tracking Transformers

GlobalTrackingTransformerspaper:https://arxiv.org/pdf/2203.13250.pdfcode:https://github.com/xingyizhou/GTR得克萨斯大学奥斯汀分校,AppleCVPR2022Introduction

Fwenxuan·2022-12-09 07:26

MOTR: End-to-End Multiple-Object Tracking with TRansformer

End-to-EndMultiple-ObjectTrackingwithTRansformer论文地址：http://arxiv.org/abs/2105.03247论文源码：https://github.com/megvii-model/MOTR收录入CVPR2021Introduction

Fwenxuan·2022-12-09 07:56

F2DNet: Fast Focal Detection Network for Pedestrian Detection

FastFocalDetectionNetworkforPedestrianDetection论文地址:https://arxiv.org/abs/2203.02331论文源码:https://github.com/AbdulHannanKhan/F2DNet.凯撒斯劳滕工业大学CVPR2022Introduction