作者丨AI算法与图像处理@知乎
来源丨https://zhuanlan.zhihu.com/p/395764136
编辑丨计算机视觉工坊
作为计算机视觉领域三大会议之一的 ICCV(IEEE International Conference on Computer Vision),已开奖。
计划将ICCV 2021 的论文和代码,以及相关的报告和解读都进行整理(欢迎star)
https://github.com/DWCTOD/ICCV2021-Papers-with-Code-Demo
视频demo和报告汇总在这里:
https://space.bilibili.com/288489574
论文和代码的主要来源:
1)arxiv.org/
2)知乎上大佬的分享
3)github.com/ 上搜索
1、AutoFormer: Searching Transformers for Visual Recognition
论文/paper:https://arxiv.org/abs/2107.00651
代码/code:https://github.com/microsoft/AutoML
2、High-Fidelity Pluralistic Image Completion with Transformers
论文/paper:https://arxiv.org/pdf/2103.14031.pdf
代码/code:https://github.com/raywzy/ICT
3、Generic Attention-model Explainability for Interpreting Bi-Modal and Encoder-Decoder Transformers (Oral)
论文/paper:https://arxiv.org/pdf/2103.15679.pdf
代码/code:https://github.com/hila-chefer/Transformer-MM-Explainability
4、PlaneTR: Structure-Guided Transformers for 3D Plane Recovery
论文/paper:https://arxiv.org/abs/2107.13108
代码/code:https://github.com/IceTTTb/PlaneTR3D
5、Pyramid Vision Transformer: A Versatile Backbone for Dense Prediction without Convolutions
解读:https://zhuanlan.zhihu.com/p/353222035
论文/paper:https://arxiv.org/abs/2102.12122
代码/code:https://github.com/whai362/PVT
6、Rethinking and Improving Relative Position Encoding for Vision Transformer
论文/paper:https://houwenpeng.com/publications/iRPE.pdf
代码/code:https://github.com/wkcn/iRPE-model-zoo
7、Rethinking Spatial Dimensions of Vision Transformers
论文/paper:https://arxiv.org/abs/2103.16302
代码/code:https://github.com/naver-ai/pit
8、Spatial-Temporal Transformer for Dynamic Scene Graph Generation
解读:https://zhuanlan.zhihu.com/p/393637591
论文/paper:https://arxiv.org/abs/2107.12309
代码/code:None
9、Tokens-to-Token ViT: Training Vision Transformers from Scratch on ImageNet
论文/paper:https://arxiv.org/abs/2101.11986
代码/code:https://github.com/yitu-opensource/T2T-ViT
10、Visual Transformer with Statistical Test for COVID-19 Classification
论文/paper:https://arxiv.org/abs/2107.05334
代码/code:None
11、Visual Saliency Transformer
论文/paper:https://arxiv.org/abs/2104.12099
代码/code:https://github.com/nnizhang/VST
本文仅做学术分享,如有侵权,请联系删文。
下载1
在「计算机视觉工坊」公众号后台回复:深度学习,即可下载深度学习算法、3D深度学习、深度学习框架、目标检测、GAN等相关内容近30本pdf书籍。
下载2
在「计算机视觉工坊」公众号后台回复:计算机视觉,即可下载计算机视觉相关17本pdf书籍,包含计算机视觉算法、Python视觉实战、Opencv3.0学习等。
下载3
在「计算机视觉工坊」公众号后台回复:SLAM,即可下载独家SLAM相关视频课程,包含视觉SLAM、激光SLAM精品课程。
重磅!计算机视觉工坊-学习交流群已成立
扫码添加小助手微信,可申请加入3D视觉工坊-学术论文写作与投稿 微信交流群,旨在交流顶会、顶刊、SCI、EI等写作与投稿事宜。
同时也可申请加入我们的细分方向交流群,目前主要有ORB-SLAM系列源码学习、3D视觉、CV&深度学习、SLAM、三维重建、点云后处理、自动驾驶、CV入门、三维测量、VR/AR、3D人脸识别、医疗影像、缺陷检测、行人重识别、目标跟踪、视觉产品落地、视觉竞赛、车牌识别、硬件选型、深度估计、学术交流、求职交流等微信群,请扫描下面微信号加群,备注:”研究方向+学校/公司+昵称“,例如:”3D视觉 + 上海交大 + 静静“。请按照格式备注,否则不予通过。添加成功后会根据研究方向邀请进去相关微信群。原创投稿也请联系。
▲长按加微信群或投稿
▲长按关注公众号
3D视觉从入门到精通知识星球:针对3D视觉领域的视频课程(三维重建系列、三维点云系列、结构光系列、手眼标定、相机标定、orb-slam3等视频课程)、知识点汇总、入门进阶学习路线、最新paper分享、疑问解答五个方面进行深耕,更有各类大厂的算法工程人员进行技术指导。与此同时,星球将联合知名企业发布3D视觉相关算法开发岗位以及项目对接信息,打造成集技术与就业为一体的铁杆粉丝聚集区,近2000星球成员为创造更好的AI世界共同进步,知识星球入口:
学习3D视觉核心技术,扫描查看介绍,3天内无条件退款
圈里有高质量教程资料、答疑解惑、助你高效解决问题
觉得有用,麻烦给个赞和在看~