-
手把手写Demo系列之车道线检测 ⭐️
- 主要内容:本文是一篇从零开始做车道线检测Demo的教学式文章,从场景的定义到模型微调的输出,描述车道线Demo式例程中在每个环节需要做的工作,以及中途可能会遇到的各种问题。
-
用20篇论文走完知识蒸馏在 2014-2020 年的技术进展 ⭐️⭐️
- 主要内容:有关知识蒸馏技术发展的综述
- 核心要点:三种主流方法:模型压缩算法,模型优化加速,优化工具与库
-
本周AI开源项目精选 | 基于pytroch的ORC算法库及python高性能CPU分析 ⭐️⭐️
- 主要内容:pytorchOCR 基于pytorch的ocr算法库,还有一些其他的,不感兴趣。
- GitHub:https://github.com/BADBADBADBOY/pytorchOCR
-
CV岗位面试题:简单说下YOLOv1,v2,v3,v4各自的特点与发展史 ⭐️⭐️
- 主要内容:YOLOv1,v2,v3,v4各自的特点与发展史,知识梳理。
-
CVPR2021|ACNet再进化,清华大学&旷视科技提出Inception类型的DBB ⭐️⭐️
- 主要内容:本文介绍了清华大学&旷视科技的丁霄汉博士在“过参数化”卷积方面继ACNet、RepVGG之后的又一次探索,它创造性的将Inception的多分支、多尺度思想与过参数化思想进行了一次组合,得到了本文所提出的DBB。
- 论文:Diverse Branch Block: Building a Convolution as an Inception-like Unit
- GitHub:https://github.com/DingXiaoH/DiverseBranchBlock
- 核心要点:
- 提出一种包含丰富信息的“微结构”且可以作为”即插即用“模块直接嵌入到现有ConvNet(保持模型的”宏观结构“不变)中提升模型性能;
- 提出了一种通用模块组件DBB,它将六种矩阵变换等价转为单个卷积,做到了“推理耗时无损”;
- 提出了一种特征表达方式类似Inception的DBB模块,它可以直接嵌入到ConvNet并取得了显著的性能提升,比如在ImageNet上取得了1.9%的top-1精度提升。
-
综述:基于图的异常检测 ⭐️⭐️
- 主要内容:本文主要介绍了2018年三篇针对图的异常检测的顶会论文,这几篇文章工作创新性强、可解释性足,且很有启发性。
-
超越Transformer!AAAI 2021最佳论文:高效长序列预测模型 ⭐️⭐️
- 主要内容:Informer 的主要工作是使用 Transfomer 实现长序列预测(Long Sequence Time-Series Forecasting),以下称为 LSTF。针对 Transfomer 在长序列预测中的不足(平方时间复杂度、高内存占用和现有编解码结构的局限性),提出 ProbSparse 注意力机制、自注意力蒸馏技术和生成式解码器等模块解决或缓解上述问题
- 论文:Informer: Beyond Efficient Transformer for Long Sequence Time-Series Forecasting
- GitHub:https://github.com/zhouhaoyi/ETDataset
- 核心要点:
- ProbSparse self-attention,笔者称其为概率稀疏自注意力,通过“筛选”Query 中的重要部分,减少相似度计算;
- Self-attention distilling,笔者称其为自注意力蒸馏,通过卷积和最大池化减少维度和网络参数量;
- Generative style decoder,笔者称为生成式解码器,一次前向计算输出所有预测结果。
-
刷爆HACS挑战赛时序动作检测榜单!TCANet:最强时序动作提名修正网络 CVPR 2021 ⭐️⭐️
- 主要内容:本文介绍了商汤科技城市计算研发组发表在CVPR2021上的工作,提出了一种基于时序上下文聚合的动作提名修正网络(TCANet)。
- 论文:Temporal Context Aggregation Network for Temporal Action Proposal Refinement
-
RankDataset:超大规模数据集加载利器 ⭐️
- 主要内容:文章介绍了RankDataset的代码训练过程,RankDataset从原理入手,在分布式的基础上,直接计算每个epoch当前rank需要训练的数据的index。优点是大量的节省内存,且不需要额外开server。
-
ORB-SLAM3中的ORB提取 ⭐️
- 主要内容:本文介绍ORB相关的一些概念,FAST特征点、BRIEF描述子、ORB如何改进得到旋转不变性,然后从工程实践上介绍金字塔图像每层特征分配数量如何计算、四叉树如何精简特征点。如果有理解上的错误,请您指正。
-
图像篡改检测 | D-Unet:用于图像篡改检测和定位的双编码器U-Net ⭐️
- 主要内容:性能优于FusionNet、C2RNet和RRU-Net等网络。
- 论文:D-Unet: A Dual-encoder U-Net for Image Splicing Forgery Detection and Localization
-
基于密度图的航空物体检测:理论与代码实现 ⭐️⭐️
- 主要内容:本文来谈一下基于深度学习的航空物体场景下的物体检测。航空物体这类场景一般由无人机空拍来收集数据,然后进行后处理来满足特定的任务场景,有些情况下要求实现实时反馈,甚至多任务。
-
基于深度学习的低光照图像增强方法总结(2017-2019) ⭐️⭐️
-
【源头活水】类似于Multi-head注意力的Multi-Cast Attention网络 ⭐️⭐️
- 主要内容:类似于Multi-head注意力的Multi-Cast Attention网络
- 论文:Multi-Cast Attention Networks for Retrieval-based Question Answering and Response Prediction
- GitHub:https://github.com/DengBoCong/nlp-paper
- 核心要点:
- 消除调用任意k次注意力机制所需架构工程的需要,且不会产生任何后果。
- 通过多次注意力调用建模多个视图以提高性能,即多播注意力(Multi-Cast Attention)。