深度学习CV文章整理

一、目标检测

1.综述文章

(1).收藏 | YOLO系列综述:从V1到V4
(2).大盘点 | 性能最强的目标检测算法
(3).这7篇CVPR 2020 目标检测论文项目都开源了!EfficientDet/ATSS/Hit-Detector/HTCN等
(4).目前是2020年最佳目标检测综述(第五期)
(5).2020年国内最新最优目标检测(完结篇)提供下载链接
(6).25篇最新CV领域综述来了!涵盖15个方向:目标检测/图像分割/医学影像/人脸识别等方向
(7).这三篇论文开源了!何恺明等人的PointRend,Hinton组的SimCLR和谷歌大脑的EfficientDet
(8).目前最全:52 个深度学习目标检测模型汇总,论文、源码一应俱全!
(9).目标检测中的不平衡问题综述
(10).继往开来!目标检测二十年技术综述
(11).3D目标检测论文汇总
(12)100 篇 CNN 必读的经典论文,包含检测/识别/分类/分割多个领域
(13)270篇CVPR 2020代码开源的论文,全在这里了!
(14)计算机视觉中的注意力机制
(15)官方DarkNet YOLO V3损失函数完结版
(16)YOLOv3最全复现代码合集(含PyTorch/TensorFlow和Keras等
(17)CVPR 2020 论文大盘点-超分辨率篇
(18)CVPR 2020 论文大盘点-行人检测与重识别篇
(19)300+篇CVPR 2020代码开源的论文,全在这里了!

2.拥挤目标检测

(1).IterDet:拥挤场景中目标检测的迭代方案
只需对训练和推理过程进行较小的修改,即可将该迭代方案应用于现有的一阶段和二阶段目标检测器,显著提升其密集目标检测性能。代码现已开源!作者团队:三星AI中心
#拥挤场景目标检测#
目标检测往往会生成大量的目标候选框,通常的做法是使用NMS过滤目标。但对于拥挤场景的目标检测,这往往会把靠的过近的正确的目标个体去掉了。
为此,本文发明了一种迭代的目标检测方法,目标检测一次后图像被再一次输入网络,但此前检测结果被保留,使其不再被检测到。这种迭代检测机制大大改进了拥挤场景的目标检测,代码已开源。
作者:三星公司
IterDet: Iterative Scheme for ObjectDetection in Crowded Environments
https://arxiv.org/abs/2005.05708v1
https://github.com/saic-vul/iterdet
(2).CVPR 2020 Oral | 旷视提出目前最好的密集场景目标检测算法:一个候选框,多个预测结果
(3)CVPR 2020 | 遮挡鲁棒的目标检测

3.小目标,尺度变化

(1)CVPR 2020 | 商汤提出SEPC:应对尺度变化的目标检测新算法
(2).目标检测 | 解决小目标检测!多尺度方法汇总
(3).在小目标检测上另辟蹊径的SNIP
(4).提升小目标检测性能!有监督特征级超分辨率方法
(5).#CVPR2020# SEPC:用于目标检测的尺度缩放金字塔卷积
涨点明显!适用于一阶段/两阶段和anchor-free目标检测网络,如FreeAnchor+SEPC在COCO上可达50.1% AP!代码刚刚开源!作者团队:商汤科技
特征金字塔已成为提取不同尺度特征的有效方法。该方法的开发主要集中在聚集不同levels的上下文信息,而很少涉及特征金字塔中的层间关联。早期的计算机视觉方法通过在空间和尺度维度上定位特征极值来提取尺度不变特征。
(6).YOLT:大尺寸图像目标检测的解决方案
(7).SCRDet++:小型/聚集/旋转的目标检测 | 通过实例级特征去噪和旋转损失平滑
作者团队:上海交通大学&安徽大学等

小而杂乱的物体在现实世界中很常见,这对检测具有挑战性。当物体旋转时,困难更加明显,因为传统的检测器通常将物体常规地定位在水平边界框中,使得感兴趣区域被背景或附近的交错物体影响。在本文中,我们首先创新性地将去噪技术引入目标检测。在特征图上执行实例级去噪,以增强对小型杂乱物体的检测。为了处理旋转变化,我们还向平滑的L1损耗添加了一个新的IoU常数因子,以解决…
深度学习CV文章整理_第1张图片
(8).小目标检测的福音:Stitcher,简单又有效
(9).提升小目标检测的思路
(10).解决小目标检测!多尺度方法汇总
(11)CVPR 2020 |商汤提出应对尺度变化的目标检测新算法

4.分割

(1).CVPR2020论文CenterMask解读
(2).一文看尽6篇CVPR 2020实例分割论文开源项目!CenterMask/PolarMask/Deep Snake等
(3).这7篇CVPR 2020 语义分割论文项目都开源了!SPNet/HANet/ContextPrior等
(4).GRoIE:用于实例分割的新型感兴趣区域提取层
本文的动机是需要克服现有RoI提取器的局限性,可用于两阶段框架的目标检测和实例分割任务,如对Mask R-CNN、Grid R-CNN都有直接涨点,代码现已开源!作者团队:帕尔玛大学

鉴于用于CV任务的深度神经网络体系结构的广泛传播,如今越来越多的新应用变得可行。其中,通过利用可从R-CNN派生的两阶段网络(例如Mask R-CNN或Faster R-CNN)获得的结果,最近特别关注实例分割。在这些复杂的体系结构中,兴趣区域…
#改进的ROI提取层# 意大利University of Parma 的论文提出一种新的目标检测和实例分割中的ROI提取层GRoIE,可以方便的插入两阶段的目标检测和实例分割网络中,显著改进精度(目标检测改进1.1%AP,实例分割改进1.7%AP),https://arxiv.org/pdf/2004.13665v1.pdf
代码已开源:https://github.com/IMPLabUniPr/mmdetection-groie
深度学习CV文章整理_第2张图片
(5).SRDA-Net:用于语义分割的超分辨率域自适应网络
本文提出一个新的端到端语义分割网络,超分辨率域自适应网络(SRDA-Net),它可以同时完成超分辨率和域自适应,这些特征完全满足通常涉及各种分辨率的遥感图像语义分割的要求。作者团队:河北工业大学&南开大学&北航
2.CVPR 2020 | 美团提出CenterMask,实例分割新网络!速度/精度更均衡
(6).PANet:基于金字塔注意力网络的图像复原(去噪/去马赛克/超分辨率等)
本模块可以灵活地集成到各种网络中,在去噪、SR、去马赛克等任务上表现SOTA!代码刚刚开源!作者团队:UIUC(Thomas S.Huang黄煦涛等)&东北大学(美国)&谷歌大脑&字节跳动AI Lab等

本文提出了一种新颖的金字塔注意力模块用于图像复原,该模块从多尺度特征金字塔中捕获远程特征对应关系。
深度学习CV文章整理_第3张图片
(7).DRU-net:用于医学图像分割的高效深度卷积神经网络
本文方法与DenseNet和AttnNet相比,具有更少的模型参数,可实现更高的分割精度,优于DU-net和RU-net等网络,论文已收录于ISBI 2020,代码即将开源!作者团队:诺丁汉大学

残差网络(ResNet)和密集连接网络(DenseNet)大大提高了深度卷积神经网络(DCNN)的训练效率和性能,主要用于目标分类任务。
深度学习CV文章整理_第4张图片
(8)来聊聊U-Net及其变种
(9)语义分割未来发展如何?

5.目标跟踪

(1).一文看尽9篇CVPR 2020目标跟踪论文开源项目!Siam R-CNN/AutoTrack/MAST等
(2).旷视开源了一套图像检索和ReID的PyTorch库
(3).多目标跟踪新范式:CenterTrack
(4).CVPR 2020(Oral) | LTMU:给跟踪器学习一个长时更新控制器
(5).港中文、商汤、中科院 CVPR 2020 点云3D目标检测算法PV-RCNN
https://github.com/sshaoshuai/PV-RCNN
https://github.com/sshaoshuai/PCDet
(6).#CVPR2020# D3S:判别式Single Shot分割目标跟踪器
20小时单卡训练出的模型,性能优于SiamRPN++、ATOM和SiamMask等网络,速度可达25 FPS,代码刚刚开源!作者团队:卢布尔雅那大学等

基于模板的判别式跟踪器由于其健壮性目前是主要的跟踪范例,但仅限于边界框跟踪和有限范围的转换模型,这降低了其定位精度。我们提出了一种判别式的single-shot分割跟踪器-D3S,它缩小了视觉对象跟踪和视频对象分割之间的差距。Single-shot网…
深度学习CV文章整理_第5张图片
(7).南京大学提出 FCOT:全卷积在线跟踪框架
本文提出第一个全卷积在线跟踪框架(FCOT),在5大数据集上表现SOTA!速度可达53 FPS,性能优于SiamFC++、DiMP和SiamRPN++等网络,代码即将开源!作者团队:南京大学(武港山组)

区分性训练已证明对于稳健的跟踪有效。但是,在线学习可以简单地应用于分类分支,而由于其复杂的设计,要适应回归分支仍然很困难。在本文中,我们介绍了第一个全卷积在线跟踪框架(FCOT),重点是为分类和回归分支启用在线学习。我们的主要贡…
深度学习CV文章整理_第6张图片
(8).#CVPR2020# DDGAN:通过退化不变性学习对现实世界中进行行人重识别
性能优于IANet、PCB、CAD-Net、RAIN和GLAD等网络,作者团队:中科大&合工大&中科院

现实世界中行人重识别(Re-ID)通常受到各种退化因素的影响,例如,低分辨率,弱照明,模糊和不利天气。一方面,这些退化导致严重的歧视性信息丢失,这严重阻碍了身份表征学习。另一方面,low-level视觉变化引起的特征不匹配问题大大降低了检索性能。解决此问题的一个直观解决方案是利用low-le…
深度学习CV文章整理_第7张图片
(9).CVPR2020 | 谷歌提出多目标(车辆)跟踪与检测框架 RetinaTrack
(10.)开源!FairMOT:多目标跟踪(MOT)新的baseline
(11)CVPR 2020(Oral)丨MAML-Tracker: 用目标检测思路做目标跟踪? 小样本即可得高准确率
(12)登顶VOT2018!南京大学提出FCOT:全卷积式在线跟踪器

6.轻量化

(1).DBFace升级,模型仅1.3M的轻量级高精度人脸检测模型
(2).YOTO来了!你只需训练一次,谷歌大脑提出调参新trick
(3)xYOLO | 最新最快的实时目标检测

7.类别检测

(1).RetinaMask:人脸口罩检测新网络
(2).PSDet+PSDD:高效通用的停车位检测网络和数据集
表现SOTA!性能优于DMPR-PS、DeepPD等网络,并提出PSDD停车位检测数据集,含7大类场景,14628个样本,数据集刚刚开源!论文已收录于IV 2020。作者团队:纵目科技&维多利亚大学
(3).CVPR 2020 AI城市挑战赛4大赛道(车辆计数、车辆重识别、车辆跟踪、交通异常检测)优胜团队代码官方汇总!
https://github.com/NVIDIAAICITYCHALLENGE/2020AICITY_Code_From_Top_Teams
(3).重磅!200G超大自动驾驶数据集A2D2下载
(4).400 fps!CenterFace+TensorRT部署人脸和关键点检测
(5).DMNet:航空影像中的密度图引导的目标检测网络
表现SOTA!性能优于ClusDet(ICCV 2019)和RON等网络,作者团队:北卡罗来纳大学夏洛特分校等

高分辨率航空图像中的目标检测是一项具有挑战性的任务,因为1)目标尺寸的大变化,以及2)目标的不均匀分布。一种常见的解决方案是将大的航拍图像分成小(均匀)的crops,然后在每个crop上应用目标检测。在本文中,我们研究了图像裁剪策略来应对这些挑战。具体而言,我们提出了一种密度图引导的目标检测网络(DMNet),该…
深度学习CV文章整理_第8张图片
(6).IYOLO(改进的YOLOv3):智能交通系统中的目标分类
IYOLO(改进的YOLOv3):智能交通系统中的目标分类

作者团队:东南大学&悉尼科技大学

智能交通系统(ITS)中的车辆和驾驶员检测技术是近年来的热门话题。特别地,驾驶员检测仍然是具有挑战性的问题,这有助于监督交通秩序和维护公共安全。本文提出一种改进YOLOv3的算法,实现对高速公路上车辆,驾驶员和人员的检测和分类,以达到区分驾驶员和乘客的目的,并形成车辆之间的一一对应关系和驱动应用。提出的模型和对比实验是在我们的自建交通驾驶员面部数据库上进行的。我们的算法的有效性通…
深度学习CV文章整理_第9张图片
(7).AIZOO开源人脸口罩检测数据+模型+代码+在线网页体验,通通都开源了
(8).树莓派打造车载车牌识别检测系统
(9)用于人脸检测的SSH算法–来自专辑Anchor-based目标检测

8.改进网络

(1).目标检测 | 高斯YoloV3值得学习应用(文中供源码链接)
(2).STAC:用于目标检测的简单有效的半监督学习框架
半监督学习(SSL)在使用未标注数据改善机器学习模型的预测性能方面具有广阔的潜力。但是目前SSL的有效范围仅限于图像分类任务。在本文中,我们提出了STAC,这是一种简单但有效的SSL框架,用于视觉目标检测以及数据增强策略。STAC可以从未标注的图像中部署高置信度的定位对象的伪标签,并通过strong增强来增强一致性,从而更新模型。
(3).CVPR2020 | 图像识别之自注意力机制(代码已开源)
(4).VoVNet:实时目标检测的新backbone网络
(5).用于改进目标检测和实例分割的CIoU Loss和聚类NMS
提出CIoU损失和Cluster-NMS,其可显著提升实例分割网络,如YOLACT性能;并显著提升目标检测网络,如YOLOv3、SSD和Faster R-CNN等,代码刚刚开源!作者团队:天津大学(DIoU作者)&哈工大

基于深度学习的目标检测和实例分割取得了空前的进展。在本文中,我们提出使用Complete-IoU(CIoU)损失和Cluster-NMS来增强边界框回归和非极大值抑制(NMS)中的几何因素,
深度学习CV文章整理_第10张图片
(6).LSCN:通过分类细化进行Low-Shot目标检测
本文提出新的low-shot分类校正网络(LSCN),该网络可以用于任何基于anchor的检测器中,以直接提高数据稀有类别的检测精度,而不会牺牲基本类别的性能,表现SOTA!性能优于Meta-RCNN、YOLO Low-Shot等网络,作者团队:新加坡国立大学&A*STAR
深度学习CV文章整理_第11张图片
(7).BiANet:用于RGB-D显著性目标检测的双边注意力网络
表现SOTA!性能优于D3Net、DMRA、CPFP和TANet等网络,速度高达80 FPS!作者团队:南开大学&&天津大学

利用深度图像时,大多数现有的RGB-D显著性目标检测(SOD)方法都集中在前景区域。但是,背景技术还为传统的SOD方法提供了重要的信息,以提高性能。为了更好地探究前景和背景区域中的显着信息,本文针对RGB-D SOD任务提出了一个双边注意力网络(BiANet)
深度学习CV文章整理_第12张图片
(8).PSAM:结合自注意力模块和特征金字塔网络的显著性目标检测
在DUTS-TE等5大数据集上表现SOTA!性能优于AFNet、MLMSNet和PAGE-Net等网络,作者团队:伦敦帝国学院

通过使用全卷积网络(FCN),显著性目标检测已取得了很大的进步。但是,基于FCN的U形体系结构可能会在自上而下的路径中的上采样操作期间导致高级语义信息中的dilution问题。因此,它可以削弱显著性目标定位的能力并产生退化的边界。
(9).MobileDets:搜索移动加速器的目标检测网络
适用于CPU、EdgeTPU和DSP等硬件的目标检测NAS网络,优于MobileNetV3 + SSDLite等网络,作者团队:威斯康星大学&Google

基于depthwise的Inverted bottleneck层已成为移动设备上最新目标检测模型的主要构建模块。在这项工作中,我们通过重新讨论常规卷积的有用性来质疑这种设计模式在广泛的移动加速器中的最优性。
深度学习CV文章整理_第13张图片
(10).#CVPR2020# 深入了解协同显著性目标检测
本文提出CoSOD3k新数据集,并全面总结了34种最先进的算法,在四个现有CoSOD数据集(MSRC/iCoSeg等)和CoSOD3k对其中的19个进行了基准测试。作者团队:南开大学(程明明组)&IIAI&武汉大学&西电

协同显著性目标检测(Co-salient,CoSOD)是显著性目标检测(SOD)的一个新兴且增长迅速的分支,旨在检测多个图像中共现的显著性目标。但是,现有的CoSOD数据集通常存在严重的数据偏差,它假定每…
深度学习CV文章整理_第14张图片(11).#CVPR2020# SiamAttn:用于视觉目标跟踪的可变形孪生注意力网络
表现SOTA!性能优于DIMP、SiamRPN++、SiamDW和ATOM等网络,作者团队:码隆科技

基于孪生(Siamese)的跟踪器在视觉目标跟踪方面取得了出色的性能。但是,目标模板不会在线更新,并且目标模板和搜索图像的特征是在Siamese体系结构中独立计算的。在本文中,我们通过引入一种计算可变形的自注意力(self-attention)和交叉注意力(cross-attention)的新…
深度学习CV文章整理_第15张图片
(12).Dynamic R-CNN:通过动态训练实现高质量的目标检测
在COCO上50.1 AP!表现SOTA!性能优于TridentNet、Libra R-CNN等网络,代码刚刚开源!作者团队:中科院&国科大&图森未来(王乃岩)

在这项工作中,我们首先指出固定网络设置和动态训练过程之间的不一致问题,这会极大地影响性能。例如,固定标签分配策略和回归损失函数无法适应proposals的分布变化,因此不利于训练高质量的检测器。因此,我们提出Dynamic R-CNN根据训练期间pro…
深度学习CV文章整理_第16张图片
(13).53.TOG:针对实时目标检测系统的对抗目标梯度攻击
TOG:针对实时目标检测系统的对抗目标梯度攻击

对YOLOv3和SSD实时目标检测器进行攻击,"摧毁"效果显著。作者团队:佐治亚理工学院

本文提出了三种针对性的对抗性目标梯度攻击,简称为TOG,它们可能导致最先进的深度目标检测网络遭受目标消失,目标无中生有和目标错误标记攻击。同时还提出了一种通用的目标梯度攻击,将对抗性可传递性用于黑盒攻击,该攻击对任何输入都有效,且攻击时间成本可忽略。我们使用YOLO和SSD对两个基准数据集(PASCAL VOC和MS COCO)进行实验…
深度学习CV文章整理_第17张图片
(14).HDD-Net:具有hand-crafted和学习到的混合特征检测器和描述符
在图像匹配和3D重建等任务上,优于R2D2、D2-Net、SuperPoint和SIFT等,作者团队:帝国理工学院&华为诺亚实验室&慕尼黑工业大学
(15)即插即涨2-3%!AC-FPN:用于目标检测的注意力引导上下文的特征金字塔网络
(16)CVPR2020 | 南开大学提出SCNet:自校正卷积网络,无复杂度增加换来性能提升
(17)54.7 AP!最强的目标检测网络:DetectoRS(已开源)
(18)Attention最新进展
(19)超越Focal Loss!AP-Loss:提高单阶段目标检测性能的分类损失
(20)ResNeSt 登顶COCO数据集(目标检测,实例分割,全景分割)
(21)目标检测新坑来了!对标Faster R-CNN!FAIR提出DETR:用Transformers来进行端到端的目标检测
(22)YOLO3改进版!Poly-YOLO:更快,更强,还支持实例分割!
(23)Focal Loss改进版来了!GFocal Loss:良心技术,无Cost涨点!
(24)目标检测算法之Light-Head R-CNN

9.样本不平衡问题

(1).ProbaNet:用于目标检测的Proposal平衡网络
旨在解决样本不平衡问题,与两阶段目标检测器(如R-FCN、Faster R-CNN等)兼容,仅有极少的额外计算成本,但涨点较为明显!作者团队:电子科技大学
由基于卷积神经网络(CNN)的目标检测器生成的候选目标proposals遇到容易遇到的样本不平衡问题,这可能会影响整体性能。在这项研究中,我们提出了一个Proposal平衡网络(ProbaNet)来缓解不平衡问题。
(2).#CVPR2020# 超越Focal Loss!阿里巴巴提出DR Loss:解决目标检测的样本不平衡问题
用DR Loss替代Focal Loss,并使用ResNet-101作为backbone,就可以直接将COCO上的39.1% mAP提高到41.7%!代码在23个小时前,刚刚开源!作者团队:阿里巴巴

样本不平衡问题是one-stage目标检测算法中一直存在的问题,负样本(背景)的数目远大于正样本,简单样本远大于难例,从而导致训练无法收敛到很好的解。本篇论文则提出一种新…
深度学习CV文章整理_第18张图片

10.3D目标检测

(1).谷歌大脑&Waymo提出:基于LiDAR点云的流式3D目标检测
本文提出一个3D目标检测器,该检测器消除了人为的延迟限制(如数据捕获),而是对本机流数据进行操作以显著减少latency。作者团队:谷歌大脑&Waymo
动态环境中的自动驾驶,车辆感知并做出反应的速度会影响系统的安全性和有效性。 LiDAR提供了一种出色的感知性能,可为许多现有的感知系统提供信息,包括目标检测,分割,运动估计和行为识别。

(2).基于YOLOv3和K-Means的图像和点云3D目标检测方法
作者团队:东京大学&AIST

基于激光雷达的3D目标检测和分类任务对于自动驾驶(AD)至关重要。激光雷达传感器可以提供周围环境的3D点编码数据重建。但是3D点云中的检测仍然需要强大的算法挑战。本文共分三个部分(1)激光雷达校准仪。(2)基于YOLO的检测和PointCloud提取;(3)基于k均值的点云分割。 在我们的研究中,Camera可以使用YOLO捕获图像以进行实时2D目标检测,然后将边界框转移到特征为对…
深度学习CV文章整理_第19张图片
(3).#CVPR2020(Oral)# 3DSSD:基于点的3D单阶段目标检测器
表现SOTA!性能优于PointPillars、SECOND等基于voxel的网络,速度高达25 FPS!代码20小时前刚刚开源!作者团队:港中文(贾佳亚组)&港科大

当前,有许多种基于voxel的3D单阶段检测器,然而基于点的单阶段方法仍未得到充分的研究。在本文中,我们首先提出了一种轻巧有效的基于点的3D单阶段目标检测器,称为3DSSD,在精度和效率之间实现了良好的平衡。在这种范例中,所有现有的…
深度学习CV文章整理_第20张图片
(4).CVPR2020 | 阿里结构感知3D目标检测,KITTI BEV 排行榜第一!
(5).何恺明团队最新研究:3D目标检测新框架VoteNet,直接处理点云数据,刷新最高精度
(6).想做计算机视觉方面,看过3d目标检测,程序难理解。不会改进,想问有没有其他易程序理解和发文章的方向?

11.论文学习

(1).从零开始学习YOLOv3教程资源分享
(2).全网第一SoTA成绩却朴实无华的pytorch版efficientdet
(3).PyTorch版EfficientDet比官方TF实现快25倍?这个GitHub项目数天狂揽千星
(4).目标检测系列三:奇技淫巧
(5).扫描式SSD用于公式检测,代码已开源
(6).科普:目标检测Anchor是什么?怎么科学设置?[附代码]

二.卷积相关

1.华为提出DyNet:动态卷积
2.旷视提出DRConv:动态区域感知卷积,提升分类/检测/分割性能!
3.九州大学提出:正则化池化(Regularized Pooling)
本文提出了正则化池化,其可使池化操作中的值选择方向在相邻kernels之间在空间上平滑,从而仅补偿实际deformations。对手写字符图像和纹理图像的实验结果表明,与常规的池化操作相比,正则化池化不仅可以提高识别精度,而且可以加快学习的收敛速度。作者团队:九州大学(日本)
4.图卷积网络到底怎么做,这是一份极简的Numpy实现
5.来聊聊可形变卷积及其应用
6.感受野
https://github.com/google-research/receptive_field
7.超越BN-ReLU!谷歌大脑等提出EvoNorms:归一化激活层的进化

三.网络相关

1.《生成对抗网络》综述(附257页ppt下载)
2.来聊聊ResNet及其变种
3.AutoTune:自动调整卷积神经网络以改善迁移学习
本文提出了一种新颖的框架:AutoTune,其可针对目标数据集自动调整预训练的CNN,同时将学习到的知识从源任务转移到目标任务。作者团队:印度信息技术研究所

迁移学习通过使用在大规模数据集上预先训练的深度网络,能够解决数据有限的特定任务。通常,在将学习到的知识从源任务迁移到目标任务的同时,最后几层将在目标数据集上进行微调(重新训练)。但是,这些层最初是为源任务设计的,可能不适合目标任务。
深度学习CV文章整理_第21张图片
4.一位中国博士把整个CNN都给可视化了,可交互有细节,每次卷积ReLU池化都清清楚楚
5.【深度学习】 神经网络为何非要激活函数?
6.真会玩!在《我的世界》里搭建神经网络,运行过程清晰可见,这位印度小哥开发的新玩法火了
7.G-SD:重新思考基于类别判别性的CNN通道剪枝
本文是对"判别式函数对通道剪枝的有效性"的第一个研究,并提出G-SD,性能优于FPGM、GAL等剪枝方法。作者团队:普林斯顿大学(刘雨晨等人)

通道剪枝(Channel pruning)已越来越受到网络压缩的关注。尤其是,基于类别判别性(class-discrimination)的通道剪枝已取得重大进展,因为它与CNN的分类目标完美契合,并提供了良好的可解释性。
深度学习CV文章整理_第22张图片
7.ResNet到底在解决一个什么问题呢?
8.#CVPR2020# SAN:探索用于图像识别的自注意力
本文探索了pairwise和patchwise两种自注意力方法,可显著提高分类、识别任务性能,代码在13个小时前刚刚开源!作者团队:港中文(贾佳亚组)&Intel实验室

最近的工作表明,自注意力(self-attention)可以作为图像识别模型的基本构建块。我们探索自注意力的变化并评估其对图像识别的有效性。我们考虑两种形式的自注意力力。一个是pairwise self-attention,它概括了标准点积的注意力…
深度学习CV文章整理_第23张图片
9.#CVPR2020# SCNet:通过自校准卷积改进卷积网络
即插即用的SCNet可应用于不同backbone,如:SCNeXt,SE-SCNet等,以在各种视觉任务中显著改善性能,包括图像识别,目标检测,实例分割和关键点检测等任务,代码在21个小时前开源!作者团队:南开大学(程明明组)&新加坡国立大学&字节AI Lab

CNN的最新进展主要致力于设计更复杂的体系结构,以增强其表征学习能力。在本文中,我们考虑在不调整模型架构的情况下改进CNN的基本卷积特征转换过程。为此,…
深度学习CV文章整理_第24张图片
10.论文复习:
视频地址:
https://www.bilibili.com/video/BV1aa4y1x7vj
github项目地址:
https://github.com/Machine-Learning-Tokyo/CNN-Architectures/tree/master/Implementations
项目链接:
下载:https://www.lanzous.com/ib5scij 密码:7w0r
11.Micro-Dense Nets | 当残差学习遇到密集聚合:重新思考深度神经网络的聚合
一种具有全局残差学习和局部微密聚合的新颖架构,表现SOTA!性能优于Res2Net和Res2NeXt等网络,同时还可以与NAS网络结合进而提高性能,作者团队:香港城市大学&南洋理工大学
目前已经提出了各种架构(例如GoogLeNet,ResNet和DenseNet)。但是,现有网络通常遭受卷积层冗余或参数利用不足的困扰。为了解决这些具有挑战性的问题,我们提出了Micro-Dense …
深度学习CV文章整理_第25张图片
12.又一个ResNet改进版来了!IResNet:可训练超3000层网络!
13.IResNet:用于图像识别和视频识别的改进残差网络
本文是ResNet的改进版,并为CNN的深度建立了一个新的里程碑!IResNet成功地在ImageNet上训练了404层网络,并在CIFAR-10和CIFAR-100上成功训练了3002层网络,而基线却无法在这样的极端深度收敛。代码刚刚开源!作者团队:起源人工智能研究院(IIAI)

残差网络(ResNets)代表了一种强大的卷积神经网络(CNN)体系结构,已广泛用于各种任务中。在这项工作中,我们提出了ResNets的改…
深度学习CV文章整理_第26张图片
14.当UNet遇见ResNet会发生什么?
15.超越FPN和NAS-FPN!特征金字塔网格(FPG)来了!
16.#CVPR2020# AutoNL:面向轻量级非局部网络的NAS
32个小时搜索到的AutoNL模型,在ImageNet上达到了77.7%的Top-1精度,优于MixNet和EfficientNet等网络,代码刚刚开源!作者团队:约翰斯·霍普金斯大学&字节跳动AI Lab&牛津大学

Non-Local (NL) blocks 已在各种视觉任务中得到了广泛的研究。然而,由于以下挑战,很少探索将NL块嵌入移动神经网络中:1)NL块通常具有大量的计算成本,这使得难以在计算资源有…
深度学习CV文章整理_第27张图片
17.结合代码理解Pointnet网络结构
18.史上最全GAN综述2020版:算法、理论及应用
19.从文本分类来看图卷积神经网络
19.关于卷积神经网络的思考:将CNN视作泛函拟合
20.港中文周博磊发文:十年之间的CVPR与我们(附CVPR2020论文速递)
21.孪生神经网络–一个简单神奇的结构

四.机器学习算法

1.有人手写实现李航《统计学习方法》书中全部算法
2.周志华机器学习学习路线最全汇总!不止于西瓜书
3.时至今日,深度学习领域有哪些值得追踪的前沿研究?
4.机器学习在图像分类与识别中的应用(附PPT下载)
5.收藏!机器学习爱好者必备表情包
6.类别不平衡学习:论文/代码/框架/库
7.从小白视角理解『数据挖掘十大算法』
8.AI基础:数据划分、超参数调整、正则化
9.【白话机器学习】算法理论+实战之K-Means聚类算法
10.CVPR 2020 算法竞赛大盘点
11.AI入门:Transfer Learning(迁移学习)
12.B站资源推荐:复旦大学机器学习、深度学习公开课,附PDF课件下载
13.【推荐系统】深入理解YouTube推荐系统算法
14.首发:适合初学者入门人工智能的路线及资料下载
15.新建网站了!Github标星过万的吴恩达机器学习、深度学习课程笔记,《统计学习方法》代码实现,可以在线阅读了!
17.【目录】【中文】【deplearning.ai】【吴恩达课后作业目录】
18.AI基础:深度强化学习之路
19.AI基础:正则表达式
20.完结撒花!2020 最新版《神经网络和深度学习》中文版 PDF 开放下载
21.一文详尽之支持向量机算法!
22.《动手学深度学习》官方宣布新增PyTorch实现
23.Pytorch 中交叉熵 Loss 趣解

五.新冠

1.【推荐】新冠肺炎的最新数据集和简单的可视化和预测分析(附代码)
2.美国高校开源迄今为止最大新冠肺炎CT数据集
3.【机器学习实战】意大利Covid-19病毒感染数学模型及预测
4.用 Python 对新冠病毒做数据分析,我们得出哪些结论?
5.疫情蔓延让这项CV技术突然火了,盘点开源代码

六.java

1.【7万字干货】2021Java实习必看面试两百题解析

七.算法与数据结构

1.【算法知识】详解冒泡排序算法
2.第0篇 | 数据结构与算法 | 不会数据结构与算法的码农有多牛?
3.13个Offer,8家SSP,谈谈我的秋招经验
4.第2篇 | 数据结构与算法 | 一文复习完7种基本数据结构(原理+代码)
5.想学好算法?看这个 GitHub 项目就够了!

八.通信

1.5G中的基带、射频,到底是干什么用的?

九.论文排版

1.教你一次性解决毕业论文所有排版问题!转自人民日报

十.Python

1.一分钟爬取知乎5646个知乎回答(内附代码)
2.Python 最强编辑器详细使用指南!
3.Python封装通俗易懂的数据库增、删、改、查方法
4.25 个常用 Matplotlib 图的 Python 代码,干货收藏!
5.Python制作十款经典的童年游戏(附源码)
6.必读!53个Python经典面试题详解v
7.朴实无华,Python 100 例

十一.数模

1.干货|专家讲数模(1)

你可能感兴趣的:(目标检测)