2021计算机视觉-包揽所有前沿论文源码 -下半年

大家是否遇到过这种情况,就是在工作或者学习的时候,想去找一些方向的网络,但是呢,尴尬的是,老旧的网络里不想要,前沿的网络又不知道有哪些。为了解决大家的这个困扰,本人决定收集2021年上半年大部分前沿的网络相关链接,之后我会( 文 末 附 带 \color{blue}{文末附带} 公 众 号 − \color{blue}{公众号 -} 海 量 资 源 。 \color{blue}{ 海量资源}。 ):

每 周 一 更 新 一 次 ( 下 面 是 我 多 年 年 收 集 的 链 接 地 址 ) \color{red}{每周一更新一次(下面是我多年年收集的链接地址) }
2019计算机视觉-包揽所有前沿论文源码
2020计算机视觉-包揽所有前沿论文源码
2021计算机视觉-包揽所有前沿论文源码 -上半年

有兴趣的朋友可以加微信:17575010159 相互讨论技术。若是帮助到了你什么,一定要记得点赞!因为这是对我最大的鼓励!

视觉工作项目-为后来的你,提供一份帮助!
上 面 这 个 链 接 是 我 所 有 工 作 项 目 的 详 细 解 。 \color{red}{上面这个链接是我所有工作项目的详细解。}

 

文章分类

(01)超全总结!2020年那些大牛AI论文
(02)重磅!腾讯优图17篇论文入选ICCV 2021
(03)ICML 2021杰出论文公布!上交大校友折桂,田渊栋rebuttal加分论文获荣誉提名
(04)ICCV 2021 放榜!一文看尽10篇论文的开源项目(检测/分割/Transformer等)
(05)ICCV2021
(06)2021年 CV 方向综述文章分类汇总~
(07)CVPR 2021 745 篇已出论文最全分类汇总!
(08)CVPR2021 论文大盘点:全景分割论文汇总(共15篇)
(09)最新综述!深度神经网络视觉识别!共计329篇文献!西安交大、清华等合作出品!

 

人脸技术

(01)曾经最强性能的人脸检测算法(Wider Face Dataset)
(02)FacePlay:AI换脸 再度来袭
(03)MDFR :基于人脸图像复原和人脸转正联合模型的人脸识别方法
(04)【人脸表情识别】基于视频的人脸表情识别数据集与基本方法
(05)DeepFaceLive:实时换脸再升级!让你直播换脸刘亦菲!
(06)CVPR2021丨帝国理工+华为:3D人脸单样本纹理补全
(07)结合人脸识别元辅助学习的AU单元检测
(08)OpenForensics: Large-Scale Challenging Dataset For Multi-Face Forgery Detection And Segmentation In-The-Wild:用于自然人脸造假图像检测与分割的大规模数据集:
(09)腾讯优图TFace正式开源,更可信的人脸识别!
(10)[CVPR 2021 Best Paper Candidate] 32篇最佳征稿通知!ICCV 2021 第一届面向意图论文候选已公布,猜一猜哪篇最终荣获 CVPR 2021 最佳论文?
(12)人脸表情和姿态变化万般丝滑——基于 3D 人脸动态的图像-视频生成方法
(13)DeepFake噩梦来了!武大&阿里提出FakeTagger,准确率达95%!
(14)ICCV 2021 | 京东SynFace:基于生成数据的人脸识别
(15)结合人脸识别元辅助学习的AU单元检测
(16)技术综述】基于 3DMM 的三维人脸重建技术总结

 

目标检测(异常检测)

(01)YOLOR在鬼吹灯片段的检测效果(Demo)
(02)口罩检测算法研究现状
(03)工业图像异常检测最新研究总结(2019-2020)
(04)工业图像异常检测最新研究总结(2019-2020)
(05)​ICCV 2021丨Oriented R-CNN:面向旋转目标检测的 R-CNN
(06)人类高质量视觉模型YOLOP开源:同时处理三大视觉任务,还能各种超越SOTA…
(07)工业缺陷检测,如何实现质检率80%提升?
(08)51.1 AP!TOOD:刷新单阶段目标检测新纪录!ICCV 2021 Oral
(09)ICCV 2021 Oral | 重新思考人群计数和定位:一个纯粹基于点的框架
(10)用于小目标检测的一个简单高效的网络
(11)YoloALL: 解决不同版本YOLO的选择进行目标检测推理(源代码已开源)
(12)通过显式寻找物体的 extremity 区域加快 DETR 的收敛:Conditional DETR
(13)2021年小目标检测最新研究综述
(14)干货总结 | 旋转目标检测全面综述:论文方法与代码
(15)ShuffleNetV2-Yolov5 更轻更快易于部署的yolov5
(16)深度学习之目标检测-两阶段检测算法介绍
(17)11种基于关键点的Anchor-free目标检测综述
(18)2021年小目标检测最新研究综述
(19)YOLOV4损失函数详解
(20)YOLOV5算法的改进策略
(21)目标检测性能评价指标
(22)基于 YOLOv5 的变电站人员检测
(23)Yolo利息的王者:高效且更精确的目标检测框架(附源代码)
(24)目标检测难题 | 小目标检测策略汇总
(25)2021年小目标检测最新研究综述
(26)收藏 | 在yolov5上验证一些不成熟的想法
(27)055 | 深度即插即用去噪CNN正则器实现高光谱图像异常检测(TGRS 2021)7)
(28)ICCV2021最佳检测之一:视频详细讲解框架及实验分析
(29)11种Anchor-free目标检测综述 – Keypoint-based篇
(30)一文看尽 6篇 CVPR2021 伪装目标检测、旋转目标检测论文
(31)DETR目标检测新范式带来的思考
(32)超强!MDETR:基于Transformer的端到端目标检测神器!开源!
(33)无需检测器提取特征!LeCun团队提出MDETR:实现真正的端到端多模态推理|ICCV 2021 Oral
(34)详细解读SSPNet:小目标检测该如何进行改进?
(35)ICCV2021最佳检测之一:主动学习框架较大提升目标检测精度(附论文下载)
(36)【论文解读】​YOLOX: Exceeding YOLO Series in 2021
(37)ICCV2021|性能优于何恺明团队MoCo v2,DetCo:为目标检测定制任务的对比学习
(38)吊打一切现有版本的YOLO!旷视重磅开源YOLOX:新一代目标检测性能速度担当!
(39)基于深度学习的汽车尾气目标检测之一
(40)ICCV2021|性能优于何恺明团队MoCo v2,DetCo:为目标检测定制任务的对比学习
(41)一文看尽 6篇 CVPR2021 2D 异常检测论文
(42)BBAug: 一个用于PyTorch的物体检测包围框数据增强包
(43)半监督辅助目标检测:自训练+数据增强提升精度(附源码下载)
(44)Trans论文 | Proposal Learning用于半监督的目标检测
(45)速度最快250fps!实时、高性能车道线检测算法LaneATT
(46)目标检测的提升很大程度上受益于骨干网的改进,CBNetV2架构将多个相同的主干网分组,
(47)YOLOX 在 MMDetection 中复现全流程解析
(48)ShuffleNetV2-Yolov5 更轻更快易于部署的 yolov5
(49)极市直播|CVPR 2021-汪瑜:针对域自适应目标检测的域特异性特征抑制
(50)51.1AP!单阶段检测器的新纪录,TOOD:即插即用的检测器换头术,显著提升性能
(51)深入浅出Yolo系列之Yolox核心基础完整讲解
(52)YOLO-FastestV2:更快,更轻!移动端高达300 FPS!参数量仅250k
(53)超越YOLOv4和v5!YOLOR:目标检测速度更快!性能更强!
(54)ICCV 2021 | 复旦&港大提出GraphFPN:用图特征金字塔提升目标检测性能!
(55)让小目标无处遁形!北航提出 TPH-YOLOv5:Transformer与YOLO的碰撞
(56)全面解读YOLO的X版本
(57)YOLOS:通过目标检测重新思考Transformer(附源代码)
(58)当Transformer遇见YOLOv5!TPH-YOLOv5:让小目标无处遁形!
(59)Anchor-free目标检测 | 工业应用更友好的新网络(附大量相关论文下载)
(60)目标检测新框架CBNet | 多Backbone网络结构用于目标检测(附源码下载)
(61)用于小目标检测的一个简单高效的网络
(62)YOLO-FastestV2:更快,更轻!移动端高达300 FPS!参数量仅250k
(63)特别小的目标检测识别(附论文下载)
(64)多尺度深度特征(下):多尺度特征学习才是目标检测精髓(论文免费下载)
(65)目标检测新框架:大幅度提升检测精度(附源代码下载)

 

分类,重识别(主干网络)

(01)两个ICCV 2021上的涨点神器!
(02)CVPR 2021最新开源 | 用于位置识别的多尺度融合
(03)ResNet超强变体CoTNet!一种新的Transformer计算机视觉模块!
(04)IJCAI 2021 | 不确定性感知小样本图像分类模型,实现SOTA性能
(05)达摩院首次将Pure Transformer模型引入目标重识别,论文入选ICCV 2021
(06)DeiT比ResNet强在哪里?
(07)MicroNets:更小更快更好的MicroNet,三大CV任务都秒杀MobileNetV3
(08)CoTNet-重磅开源!京东AI Research提出新的主干网络CoTNet,在CVPR上获得开放域图像识别竞赛冠军
(09)深度学习行人重识别综述与展望
(10)ResNet超强变体:京东AI新开源的计算机视觉模块!(附源代码)
(11)MicroNets:更小更快更好的MicroNet,三大CV任务都秒杀MobileNetV3

 

语义实例分割

(01)基于深度学习的图像抠图算法
(02)基于UNET网络模型道路垃圾语义分割背景介绍
(03)超强实时人像抠图算法开源,随心所欲背景替换!
(04)ICCV 2021 Oral | 南大&腾讯提出基于挖掘潜在类别的小样本分割
(05)ICCV 2021 | Transformer再助力!用CWT进行小样本语义分割
(06)极市直播|CVPR 2021-汪瑜:针对域自适应目标检测的域特异性特征抑制
(07)MICCAI 2021 | BiX-NAS:为医学图像分割搜索高效的双向架构
(08)“先粗后精”的实例分割,BPR:使用Crop-then-Refine的性能提高方法
(09)CVPR2021 分割之“Boundary IoU”,衡量物体边界分割质量的新度量
(10)CondLaneNet | 使用"动态卷积核"预测每个车道线实例
(11)RefineMask:实例分割,使用细粒度信息增强性能
(12)ICRA2021 | RoadMap:面向自动驾驶视觉定位的轻量级语义地图
(13)大连理工IIAU Lab提出MS-APS:结合多源信息,对动/静预测器自动筛选的视频目标分割网络(ACM MM’21 Oral)
(14)图像分割模型调优技巧,loss函数大盘点
(15)还在用ViT的16x16 Patch分割方法吗?中科院自动化所提出Deformable Patch-based方法,涨点显著!
(16)LaneAF | 利用Affinity Field聚类进行车道线实例分割
(17)Query Generation Module-NTU用多样性的query生成,涨点基于文本的实例分割(已开源)
(18)实践教程 | 年轻人的第一个深度学习图像分割项目应该是什么样的(Pytorch 框架)?
(19)CVPR2021 论文大盘点:全景分割论文汇总(共15篇)
(20)ICCV 2021 | 实例分割新思路!腾讯&华中科大重磅开源QueryInst:又快又好!
(21)MICCAI 2021 | 深圳大学MUSIC医学超声实验室萌新的论文分享!
(22)视频PS神器!人物隐身消失!视频修复新工作!代码开源!ICCV 2021
(23)全景分割新标杆!南大&港大提出:Panoptic SegFormer
(24)分割算法——可以分割一切目标(各种分割总结)
(25)nnFormer (Not-aNother transFORMER): 基于交叉Transformer结构的3D医疗影像分割网络
(26)2021年,图像分割在这个领域杀疯了!!!
(27)ICCV 2021 | 实例分割新思路!腾讯&华中科大重磅开源QueryInst:又快又好!
(28)Query Generation Module-NTU用多样性的query生成,涨点基于文本的实例分割(已开源)
(29)用简单Mask分类实现语义分割、实例分割“大一统”!Facebook&UIUC开源MaskFormer

 

目标追踪

(01)屠榜目标跟踪!大连理工和MSRA提出STARK:基于Transformer的目标跟踪器 | ICCV 2021
(02)ICCV2021 Challenge | 多视角行人追踪

 

动作检测与识别(视频理解-行为分析)

(01)大规模视频内容理解:淘宝视频内容标签的结构化分析和管理
(02)大规模视频内容理解:淘宝视频内容标签的结构化分析和管理
(03)极市直播|ICCV’21 Oral-包文韬:开放世界动作识别新基准,DEAR:首个大规模视频动作识别的证据学习新模型
(09)基于深度学习的人体关键点检测研究简介
(10)安全违规行为识别算法介绍
(11)开源|CVPR 2021:第一个针对行为识别的黑盒攻击算法BASAR
(12)极市直播|ICCV’21 Oral-包文韬:开放世界动作识别新基准,DEAR:首个大规模视频动作识别的证据学习新模型
(13)ACMMM 2021《LSG》性能SOTA!用GNN和GAN的方式来强化Video Captioning的学习!

 

姿态估算

(01)ICCV 2021 | OKDHP:利用在线知识蒸馏进行高效2D人体姿态估计
(02)ICCV 2021 | OKDHP:利用在线知识蒸馏进行高效2D人体姿态估计
(03)目标检测+姿态识别:AI助力奥运公平公正打分,不再给日本奥运黑哨的机会(附源代码)
(04)目标检测+姿态识别:AI助力奥运公平公正打分,不再给日本奥运黑哨的机会(附源代码)
(05)代码实践:已开源,基于姿态估计的运动计数APP开发(二)
(06)实时检测17个人体关键点,谷歌SOTA姿态检测模型,手机端也能运行
(07)MoveNet 姿态估计,树莓派上也能跑!

 

OCR

(01)YYDS!一个针对中文的预训练模型
(02)快速上手YOLOX之前,你需要准备…
(03)重磅开源!平安产险提出TableMASTER:表格识别大师
(04)CVPR2021-RSTNet:自适应Attention的“看图说话”模型
(05)ACL2021论文之ChineseBERT:融合字形与拼音信息的中文预训练模型
(06)【SIGIR 2021 最佳学生论文】图像文本检索的动态模态交互建模
(07)开放式的Video Captioning,中科院自动化所提出基于“检索-复制-生成”的网络
(08)CVPR2021-RSTNet:自适应Attention的“看图说话”模型
(09)这个PDF提取Excel表的OCR算法开源啦!
(10)最新OCR开源神器来了!
(11)吊打一切现有开源OCR项目:效果再升7%,速度提升220%
(12)Elasticsearch 如何做到快速检索?
(13)CVPR 2021 论文大盘点-文本图像篇

 

3D,深度估算,点云,SLAM

(01)3D目标检测/点云/遥感数据集汇总
(02)激光雷达和相机联合标定 之 开源代码和软件汇总 (2004-2021)
(03)ICCV 2021丨轻舟智航提出SimTrack: 3D多目标一体化检测与跟踪,简单又精确
(04)SC-A-LOAM:在A-LOAM中加入回环检测
(05)UCLA博士带入门:室内场景下智能机器人的环境感知及定位
(06)直播 | 三维重建自监督网络JDACS-MS模型详解、结果测评与训练技巧
(07)3D点云描述子超全综述:传统方式+深度学习方式
(08)面向自动驾驶的3D点云处理技术总结(分类/分割/检测/配准/SLAM等)
(09)面向自动驾驶的3D点云处理技术总结(分类/分割/检测/配准/SLAM等)
(10)ICCV 2021 | 最新开源!多视角几何和注意力机制实现新视角合成
(11)如何入门多视角3D目标识别?超详细最新综述来袭!
(12)CVPR最佳作者新作!无监督学习可变形3D对象
(13)AR Mapping: 高效快速的AR建图方案
(14)ICCV2021|多视角残缺点云补全与配准挑战赛!
(15)MICCAI 2021 | 深圳大学MUSIC医学超声实验室萌新的论文分享!
(16)CVPR 2021 论文,住宅户型识别与重建
(17)ICCV2021 workshop 多视角残缺点云的补全与配准
(18)将合成 3D 场景表示合并到生成模型中,从而实现更可控的图像合成。
(19)BEBLID:增强的高效局部图像特征描述符
(20)ICCV 2021 Oral | NerfingMVS:引导优化神经辐射场实现室内多视角三维重建
(21)ICCV 2021 | 悉尼大学&商汤提出GUPNet:单目3D目标检测新网络
(22)ICRA2021最佳论文:CodeVIO:紧耦合神经网络与视觉惯导里程计的稠密深度重建
(23)基于深度学习的三维激光雷达动态物体分割(LiDAR-MOS)
(24)开课直播 | 多传感器融合SLAM简介及算法框架解析
(42)ICCV 2021 Oral | NerfingMVS:引导优化神经辐射场实现室内多视角三维重建
(43)直播 | 最佳三维重建网络PatchMatchNet模型详解、性能评测
(44)ICCV 2021 Oral | 清华提出PoinTr:几何敏感的点云补全Transformer
(45)CVPR2021单目深度估计:腾讯光影研究室优势夺冠,成果落地应用
(46)LiDAR+IMU+GPS 多传感器融合SLAM源码解析

 

GAN(图像生成,超分辨,动作迁移)

(01)视频超分,Transformer再下一城之VSR-Transformer
(02)超越GAN?OpenAI提出可逆生成模型Glow!图像生成太逼真
(03)基于LiDAR的多传感器融合SLAM 系列教程:LOAM、LeGO-LOAM、LIO-SAM
(04)ICRA21 | 结构化RGBD SLAM
(05)基于优化的视觉惯性SLAM与GNSS紧耦合
(05)用上GAN的推荐算法成精了,看完视频马上刷出相关文章丨KDD 2021
(06)上科大提出:对抗神经网络 动态人像系统SofGAN!
(07)MDFR :基于人脸图像复原和人脸转正联合模型的人脸识别方法
(08)单张人像生成视频!中国团队提出FaceAnime:最新3D人脸视频生成模型
(09)这个GAN没见过猪,却能把狗变成猪
(10)SIG 2021 | 无限循环:让图片动起来

(11)CVPR 2021 | GAN人脸预训练模型,让五官复原效果惊艳!
(12)装逼一步到位!GauGAN代码解读来了
(13)ACL 2021 | 难度预测和采样平滑,提高ELECTRA模型的表现!
(14)生成式视频压缩:谷歌基于GAN来实现,性能与HEVC相当
(15)介绍一篇可显式控制生成属性的人像图片生成算法
(16)CVPR2021 一种基于分布判别器的无监督的图像合成
(17)推荐一个开源生成对抗网络套件,让父亲重返18岁!
(18)4K 1000 FPS!极致视频插帧网络:XVFI-Net来了!数据集和代码已开源!ICCV 2021 Oral
(19)上科大丨ST-NeRF:视频编辑新高度,能改变时空!
(20)OMGD:字节跳动开源的最新GAN压缩算法
(21)CVPR 2021 论文大盘点-超分辨率篇

 

GNN(图神经相关)

(01)腾讯开源 GFP-GAN 代码

 

Transformer(注意力机制)

(01)Transformer 眼中世界 Vs. CNN 眼中世界
(02)加性注意力机制、训练推理效率优于其他Transformer变体,这个Fastformer的确够快
(03)【Attention九层塔】注意力机制的九重理解
(04)ICCV 2021 | 国科大提出首个高准确率CNN和Transformer双体主干网络!
(05)ICCV 2021 | PiT:重新思考视觉Transformer的空间维度
(06)深度学习attention机制中的Q,K,V分别是从哪来的?
(07)浅谈Transformer的初始化、参数化与标准化
(08)ICCV 2021 | 最新开源!多视角几何和注意力机制实现新视角合成
(09)Mobile-Former来了!微软提出:MobileNet+Transformer轻量化并行网络
(10)新模型!Conformer!Transformer与CNN的超强融合!
(11)ACL2021中的25个Transformers模型
(12)浙大和腾讯开源CrossFormer:基于跨尺度注意力的视觉Transformer
(13)靠“数据堆砌”火拼Transformer,MLP架构可有胜算?
(14)Transformer长大了,它的兄弟姐妹们呢?(含Transformers超细节知识点)
(15)论文 | COTR 一种基于Transformer的图像匹配网络
(16)ICCV2021 Oral-TAU&Facebook提出了通用的Attention模型可解释性
(17)ICCV 2021 | 最快视觉Transformer!Facebook提出LeViT:快速推理的视觉Transformer
(18)论文 | COTR 一种基于Transformer的图像匹配网络
(19)ICCV2021 Oral-TAU&Facebook提出了通用的Attention模型可解释性
(20)脑洞大开!拿Transformer和CNN比较!犯错都像人类
(21)ICCV 2021 | 视觉Transformer中的相对位置编码
(22)ICCV2021 Oral-TAU&Facebook提出了通用的Attention模型可解释性
(23)ICML2021|超越SE、CBAM,中山大学开源SAM:无参Attention!
(24)LG-Transformer:全局和局部建模Transformer结构新作
(25)ICCV 2021 Oral | 金字塔视觉Transformer(PVT):用于密集预测的多功能backbone
(26)超赞Transformer+CNN=SOTA!
(27)继 Swin Transformer 之后,MSRA 开源 Video Swin Transformer,在视频数据集上SOTA
(30)CNN+Transformer=Better,国科大&华为&鹏城实验室提出Conformer,84.1% Top-1准确率
(31)S2-MLPV2:目前最强的视觉MLP架构,空降榜一,达到83.6% Top-1准确率
(32)最强辅助 Visualizer:简化你的 Vision Transformer 可视化!
(33)搞懂 Vision Transformer 原理和代码,看这篇技术综述就够了(十五)
(34)CNN+Transformer=Better,国科大&华为&鹏城实验室提出Conformer,84.1% Top-1准确率
(35)DeepMind提出Transformer新变体:∞-former:任意长度上下文!无限长期记忆
(36)Transformer在图像复原领域的又一力作!ETH提出SwinIR:low-level视觉多项任务全面领先
(37)腾讯优图提出Evo-ViT:高性能Transformer加速方法
(38)浙大和腾讯开源CrossFormer:基于跨尺度注意力的视觉Transformer
(39)简单高效!浙大CAD&腾讯&哥大开源跨尺度的Transformer,显著涨点检测、分割、分类三大CV任务!
(40)ICCV 2021 | 阿里达摩院视觉实验室提出OadTR框架,将Transformers引入在线行为检测任务
(41)7 Papers & Radios | Transformer新变体∞-former;谷歌1370亿参数模型比GPT-3更强
(42)DeepMind提出Transformer新变体:∞-former:任意长度上下文!无限长期记忆
(43)nnFormer (Not-aNother transFORMER): 基于交叉Transformer结构的3D医疗影像分割网络
(44)搞懂 Vision Transformer 原理和代码,看这篇技术综述就够了(十六)
(45)霸榜COCO和Cityscapes!南理工&CMU提出极化自注意力,更精细的双重注意力建模结构

 

半监督 ,无监督,强化学习

(01)由Facebook发布的非监督学习DINO引发的深入思考
(02)CVPR 2021 | 强化学习太脆弱?VAI: 用注意力和不变性来让像素输入的强化学习更加稳定
(03)细说何恺明团队在无监督领域的顶作:MoCo三部曲
(04)ICCV 2021 Oral | 何恺明团队提出MoCo v3:训练自监督视觉Transformer的实证研究
(05)Swin Transformer为主干,清华等提出MoBY自监督学习方法,代码已开源
(06)大概是全网最详细的何恺明团队顶作 MoCo 系列解读!(下)
(07)CVPR 2021 | 强化学习太脆弱?VAI: 用注意力和不变性来让像素输入的强化学习更加稳定
(08)ICCV2021 | 如何高效视频定位?QMUL&北大&Adobe强强联手提出弱监督CRM,性能SOTA
(09)ICCV2021 | 如何高效视频定位?QMUL&北大&Adobe强强联手提出弱监督CRM,性能SOTA

 

模型优化,压缩,加速,NAS(网络搜索)

(01)ICCV 2021|"白嫖"性能的MixMo!一种新的数据增广or模型融合方法
(02)精度不变,两行代码无痛实现推理加速1.34倍,极市平台联合OpenVINO™加速AI开发部署
(03)YOffleNet | YOLO V4 基于嵌入式设备的轻量化改进设计
(04)【模型压缩】Only Train Once:微软、浙大等研究者提出剪枝框架OTO,无需微调即可获得轻量级架构
(05)ICCV 2021 | 微软MSRA提出:训练快速收敛的条件DETR
(06)克服Dropout缺陷,简单又有效的正则方法:R-Drop
(07)CVPR2021 Oral《Seeing Out of the Box》北科大&中山大学&微软提出端到端视觉语言表征预训练方法
(08)ICCV 2021|超越MobileNet V3 !详解SkipNet+Bias Loss=轻量化模型新的里程碑
(09)教程|YOLOX目标检测ncnn实现
(10)还在用全部token训练ViT?清华&UCLA提出token的动态稀疏化采样,降低inference时的计算量
(12)[月亮]Pi-NAS(无监督)在神经架构搜索任务中可以同时解决feature shift 和 parameter shift 问题。
(13)USC提出拟牛顿法深度学习优化器Apollo,效果比肩SGD和Adam
(14)神经网络调参经验大汇总
(15)MICCAI 2021 | BiX-NAS:为医学图像分割搜索高效的双向架构
(16)Only Train Once!微软&浙大提出剪枝新框架OTO:无需微调即可获得轻量级架构!
(17)Mobile-Former来了!微软提出:MobileNet+Transformer轻量化并行网络
(18)综述:轻量级CNN架构设计
(19)NAS+CNN+Transformer=ViT-Res!MIT团队重磅开源ViT-Res,精度高于DeiT-Ti8.6%
(20)CVPR2021性能提升:Facebook提出FP-NAS——搜索速度更快、分类精度更高、性能更好
(21)NAS+CNN+Transformer=ViT-Res!MIT团队重磅开源ViT-Res,精度高于DeiT-Ti8.6%

 

数据集(数据增强),比赛,标注工具,实用工具

(01)UNET数据集增强
(02)卷积神经网络目标检测的数据增强
(03)ICCV 2021 第二届“无人机跟踪”挑战赛冠军和最佳论文
(04)李飞飞点赞!,刚刚公布了第一批数据集&benchmark入围名单
(05)深度学习-单样本数据增强方法
(07)吊打labelme,这款AI开发神器的图像标注yyds
(08)下血本!Facebook AI 20万美金举办“图像匹配”大赛
(09)ICCV 2021|"白嫖"性能的MixMo!一种新的数据增广or模型融合方法
(10)ICCV2021 新增数据集汇总 | 含动作定位、行为检测、弱光目标检测等!
(63)ICCV2021 新增数据集汇总 | 含时序动作定位、时空行为检测、弱光目标检测等!
(64)ICCV2021 Oral-新任务!新数据集!康奈尔大学提出了类似VG但又不是VG的PVG任务
(65)人类高质量视觉模型YOLOP开源:同时处理三大视觉任务,还能各种超越SOTA…
(66)CVPR 2021 Short-video Face Parsing Challenge 季军方案分享

 

杂项(多任务,多模态,涨点)

(01)OpenCV新增描述子BEBLID:提高图像匹配精度,减少执行时间
(02)理解CNN又进一步,通道维度编码位置信息,全局汇聚新研究入选ICCV21
(03)又一个炼丹神器!自动调参!解放双手
(04)ICCV 2021 | 国科大提出首个CNN和Transformer双体主干网络!Conformer准确率高达84.1%!
(05)CB Loss:基于有效样本的类别不平衡损失
(06)ICCV 2021 Oral|涨点神器!RS Loss:目标检测和实例分割的新损失函数
(07)ICCV 2021 | 超越MobileNetV3!SkipNet:面向轻量级CNN的Bias Loss
(08)即插即用!中山大学提出SimAM:无参Attention!助力分类/检测/分割涨点!
(09)一文看尽深度学习中的15种损失函数
(10)ICCV2021《MultiTask CenterNet》CV多任务新进展!一节更比三节强
(11)轻舟智航提出 SimTrack: 3D多目标一体化检测与跟踪,
(12)ACMMM 2021-多模态宝藏!京东梅涛团队重磅开源第一个适用于多个任务的多模态代码库x-modaler
(13)CVPR2021 Oral《Seeing Out of the Box》北科大&中山大学&微软提出端到端视觉语言表征预训练方法
(14)ICML 2021 (Long Oral) | 深入研究不平衡回归问题
(15)领域泛化最新综述
(16)人类高质量视觉模型YOLOP开源:同时处理三大视觉任务,还能各种超越SOTA…
(17)华中科大重磅开源YOLOP:你只需看一次全景驾驶感知!目标检测/可行驶区域分割和车道线检测三大视觉任务同时处理
(18)首次实现用MLP做检测和分割!上科大&优图开源AS-MLP:一种轴向位移的MLP框架
(19)ICCV 2021 Oral|涨点神器!RS Loss:目标检测和实例分割的新损失函数
(20)别魔改网络了,Google研究员:模型精度不高,是因为你的Resize方法不够好!
(21)基于可穿戴设备的跌倒检测
(22)基于计算机视觉的跌倒检测
(23)目标检测+姿态识别:人工智能助力各个领域加速发展(附源代码)
(24)ICCV2021 MuST:还在特定任务里为刷点而苦苦挣扎?谷歌的大佬们都已经开始玩多任务训练了
(25)ICCV 2021丨轻舟智航提出SimTrack: 3D多目标一体化检测与跟踪,简单又精确

 

文章阅读

(01)YOLOV5部署-RK3399Pro 开发板实现
(02)Pad-YoloV5,在ipad上的简单目标检测Demo
(03)动态多尺度卷积网络结构,清华、快手联合提出语种识别新方法
(04)如何克服GAN和VAE的不足?TensorBay让你快速搭建OpenAI架构!
(05)口罩污染目标检测背景介绍
(06)2021年,图像分割在这个领域杀疯了!!!
(07)超网络: HyperNetworks
(08)室内场景下,智能机器人如何感知和定位?
(09)为什么DL模型能够正确分类?SCOUTER(ICCV21’)从“正”“反”方面说服你。
(10)ICCV 2021 | 以人为中心的可信赖视觉workshop!火热征稿中
(11)深度学习中的Attention、MLP、Conv和Re-parameter论文大总结
(12)专访唐杰:万亿参数大模型只是一个开始
(13)基于深度学习的安全帽检测
(14)征稿通知!ICCV 2021 第一届面向意图表达的手绘草图研讨会
(15)CVPR 2021奖项出炉:最佳论文花落马普所,何恺明获提名,首届黄煦涛纪念奖颁布
(16)对自己深度学习方向的论文有idea,可是工程实践能力跟不上,实验搞不定怎么办?
(17)两个ICCV 2021上的涨点神器!
(18)ResNet到底在解决一个什么问题呢?
(19)基于复杂场景的跌倒行为检测背景简介
(20)LSTM之父再称ResNet、GAN等五大网络都有他的功劳!网友却说:自负大于引用数
(21)Google最新最权威的未来人工智能技术之一:人脸领域
(22)ICCV2021 Oral | UNO:用于“新类发现”的统一目标函数,简化训练流程!已开源!
(23)今晚直播 | VINS-Mono算法梳理、优缺点总结、应用案例、答疑
(24)FACIAL:更可控的说话人驱动
(25)传统的垃圾分割方法
(26)口罩检测算法研究现状

 

在这里插入图片描述

你可能感兴趣的:(自动驾驶,深度学习,人工智能)