SOTA 第4页

论文笔记--Disentangling and Unifying Graph Convolutions for Skeleton-Based Action Recognition

今天为大家介绍下这篇“重磅级”论文，目前是该方向SOTA的论文，并且从处理上来看，与之前大家不断改进的ST-GCN的那些论文来看，引入了一些新的视角，还是值得我们学习的。

Lyndsey·2023-11-23 04:41

谢撩，人在斯坦福打SoTA

文|Jazon编|小戏小编注：不知道大家还记不记得卖萌屋之前人在斯坦福，刚上CS224n的Jazon小哥发来的关于斯坦福神课CS224n上半学期的报道？今天，Jazon又在斯坦福前线发来了关于他在CS224n下半学期的经历，那么现在让我们把画面交给Jazon，看看大佬的课程作业是怎么完成的吧！上篇文章提到我在Stanford上NLP“神课”CS224n，课程的前半学期以上课、写作业为主，而后半学期

夕小瑶·2023-11-22 14:20

RT-DETR算法优化改进：Backbone改进｜RIFormer：无需TokenMixer也能达成SOTA性能的极简ViT架构 | CVPR2023

本文独家改进：RIFormer助力RT-DETR，替换backbone，RIFormer-M36的吞吐量可达1185，同时精度高达82.6%；而PoolFormer-M36的吞吐量为109，精度为82.1%。推荐指数：五星RT-DETR魔术师专栏介绍：https://blog.csdn.net/m0_63774211/category_12497375.html✨✨✨魔改创新RT-DETR引入前沿

AI小怪兽·2023-11-22 04:54

ECCV2020最佳论文RAFT：Recurrent All-Pairs Field Transforms for Optical Flow

今天介绍一下RAFT（监督学习，目前sota）。官方代码背景在RAFT之前，一些有名的光流估计方法，大都遵循金字塔结构+coarsetofine的预测flow的方式。

咆哮的阿杰·2023-11-21 17:47

基于yolov8的车牌检测训练全流程

作为一种前沿、最先进(SOTA)的模型，YOLOv8在之前版本的成功基础上引入了新功能和改进，以提高性能、灵活性和效率。YOLOv8支持全范围的视觉AI任务，包括检测,分割,姿态估计,跟踪,和分类。

心无旁骛~·2023-11-20 21:23

深度学习中的图像融合:图像融合论文阅读与实战

个人博客:Sekyoro的博客小屋个人网站:Proanimer的个人网站abs介绍图像融合概念，回顾sota模型，其中包括数字摄像图像融合，多模态图像融合，接着评估一些代表方法介绍一些常见应用，比如RGBT

procoder338·2023-11-20 15:21

Transformer模型原理

随后推出了几个有影响力的模型，包括：2018年6月：GPT，第一个预训练的Transformer模型，用于各种NLP任务的微调并获得了SOTA的结果；2018年10月：BERT，另一个大型预训练模型，旨在生成更好的句子摘要

zzZ_CMing·2023-11-19 23:47

AAAI2023 | DeMT: CNN+Transformer实现多任务学习（分割/深度估计等四项SOTA!）

点击下方卡片，关注“自动驾驶之心”公众号ADAS巨卷干货，即可获取今天是春节后的第一篇原创，关于多任务学习，AAAI2023的work，如果您有相关工作需要分享，请在文末联系我们！>>点击进入→自动驾驶之心技术交流群论文名称：DeformableMixerTransformerforMulti-TaskLearningofDensePrediction卷积神经网络（CNN）和Transformer

自动驾驶之心·2023-11-19 20:27

YOLOv8优化策略：轻量级Backbone改进 | 高效模型 (Efficient MOdel, EMO),现代倒残差移动模块设计 | ICCV2023

本文改进：面向移动端的轻量化网络模型——EMO，它能够以相对较低的参数和FLOPs超越了基于CNN/Transformer的SOTA模型，支持四个版本EMO_1M,EMO_2M,EMO_5M,EMO_6MYOLOv8

会AI的学姐·2023-11-19 17:03

RT-DETR优化策略：轻量级Backbone改进 | 高效模型 (Efficient MOdel, EMO),现代倒残差移动模块设计|ICCV2023

本文改进：面向移动端的轻量化网络模型——EMO，它能够以相对较低的参数和FLOPs超越了基于CNN/Transformer的SOTA模型，支持四个版本EMO_1M,EMO_2M,EMO_5M,EMO_6M

会AI的学姐·2023-11-19 04:41

YOLOv8-Seg改进：轻量级Backbone改进 | 高效模型 (Efficient MOdel, EMO),现代倒残差移动模块设计 | ICCV2023

本文改进：面向移动端的轻量化网络模型——EMO，它能够以相对较低的参数和FLOPs超越了基于CNN/Transformer的SOTA模型，支持四个版本EMO_1M,EMO_2M,EMO_5M,EMO_6M

会AI的学姐·2023-11-18 19:06

ECCV 2020 ｜超快的车道线检测

157530787很高兴和大家分享一下我们刚刚被ECCV2020接收的新工作：一种超快速的车道线检测算法（UltraFastStructure-awareDeepLaneDetection），能够达到SOTA

我爱计算机视觉·2023-11-16 11:06

LSTR：端到端实时车道线检测新SOTA！

表现SOTA！性能优于PolyLaneNet等网络，速度可高达420FPS！代码已开源！车道线检测是将车道标记识别为近似曲线的过程，被广

自动驾驶之心·2023-11-16 11:32

Self-Attention真的是必要的吗？微软&中科大提出Sparse MLP，降低计算量的同时提升性能！...

在这项工作中，作者探究了Transformer的自注意（Self-Attention）模块是否是其实现图像识别SOTA性能的关键。

我爱计算机视觉·2023-11-15 15:36

性能提升30%以上，实时实例分割算法SOLOv2实现产业SOTA

本文介绍了产业SOTA的实时实例分割算法SOLOv2。目标检测无法精细获得目标边界形状和面积，语义分割无法区分不同目标个体，并分别获得位置。

飞桨PaddlePaddle·2023-11-14 21:18

多聚焦图像融合资料汇总：论文，代码，数据集，评价指标

文章目录1.论文和代码1.1综述1.2传统方法1.3深度学习方法1.3.1具有代表性的方法1.3.2其他SOTA方法2.多聚焦图像融合数据集2.1公开数据集2.2生成数据集的方法3.图像融合评价指标多聚焦图像融合

ctrl A_ctrl C_ctrl V·2023-11-14 12:48

小心你的大模型被基准评估坑了，模型直接傻掉！人大高瓴揭秘大模型作弊

作者|谢年年、Python从ChatGPT横空出世到国内外「百模大战」打响以来，我们隔三差五就会看到某某大模型又超越多个模型，刷新SOTA，成功屠榜的消息。

夕小瑶·2023-11-13 01:32

C-Pack论文解读

C-MTEB：中文文本表征benchmark，包含6个任务，35个数据集C-MTP：大规模文本表征训练数据集C-TEM：不同规模（small，base，large）的中文文本表征模型，超出SOTA10%

dive_in·2023-11-12 19:46

DDBNet：Anchor-free新训练方法，边粒度IoU计算以及更准确的正负样本 | ECCV 2020

从实验来看，DDBNet达到了SOTA，整篇论文可圈可点，但里面的细节还需要等源码公开才知道来源：晓飞的算法工程笔记

晓飞的算法工程笔记·2023-11-11 11:01

Ubuntu20.04+Quadro RTX 5000，3D gaussian环境配置

3Dgaussian算是新视角生成领域目前的SOTA，可以进行实时的渲染；最大训练速度上可以与Instant相当，且质量差不多；增加迭代次数后，可以

糊烟乱雨·2023-11-10 11:42

【cvpr2022】CRIS: CLIP-Driven Referring Image Segmentation

CLIP展示了从4亿对图像-文本对学习SOTA图像级视觉概念的能力，这有助于多模态任务。2、由于图像级预测与像素级预测的差异，直接使用CLIP

lynn_Dai·2023-11-09 23:49

TC397 遇到的问题

如何定义启动地址2.1UCB(UserConfigurationBlock)2.2BMHD(BootModeHead)2.3CRC自动计算2.4TASKING配置BMHD2.5多BMHD的应用场景3.SOTA1

Archieeeeee·2023-11-09 05:08

Spatio-Temporal Tuples Transformer for Skeleton-Based Action Recognition

该方法能够在连续帧中建立不同关节的关系，有比较强的区分相似动作的能力，达到了sota。帧之间不同关节的相关性对行为识别非常有用，在一个动作中，相邻帧之间的不同身体部位常常是一起移动的（

开心的火龙果·2023-11-09 02:46

本地部署 CogVLM

CogVLM-17B在10个经典跨模态基准测试上取得了SOTA性能，包括NoCaps、Flicker30kcaptioning、RefCOCO、RefCOCO+、RefCOC

engchina·2023-11-07 10:31

汽车网络安全渗透测试概述

汽车网络安全威胁分析2.1汽车网络安全资产定义2.2汽车网络安全影响场景及评级示例3.汽车网络安全渗透测试描述3.1参考法规3.2渗透测试内容4.小结1.汽车网络安全法规概述近年来，汽车智能化程度快速提升，SOTA

CyberSecurity_zhang·2023-11-06 17:25

SAM 微调在医学上的尝试

1、2023下半年1、UNet与SAM结合的正确的道路SAMUS,一路SOTA没对手！

贝猫说python·2023-11-06 15:08

用傅里叶卷积实现"万物隐身"！三星这个LaMa神器可试玩！

机器之心|编辑：杜伟、陈萍将快速傅里叶卷积引入网络架构，弥补感受野不足的缺陷，来自三星、洛桑联邦理工学院等机构的研究者提出了LaMa（largemaskinpainting）方法，在一系列数据集上改进了SOTA

Amusi（CVer）·2023-11-06 07:37

BEV-LaneDet：暴涨十个点，单目3D车道线新SOTA！

点击下方卡片，关注“自动驾驶之心”公众号ADAS巨卷干货，即可获取点击进入→自动驾驶之心【车道线检测】技术交流群后台回复【车道线综述】获取基于检测、分割、分类、曲线拟合等近几十篇学习论文！简介3D车道检测在自动驾驶轨控中起着至关重要的作用，最近成为自动驾驶领域一个快速发展的话题。之前的工作由于其复杂的空间转换模块和不灵活的三维车道表示很难真正在实际业务中应用。面对这些问题，本文提出了一个高效且简单

自动驾驶之心·2023-11-05 18:26

BEV-LaneDet：暴涨十个点，单目3D车道线新SOTA！（CVPR'23）...

点击下方卡片，关注“自动驾驶之心”公众号ADAS巨卷干货，即可获取点击进入→自动驾驶之心【车道线检测】技术交流群后台回复【车道线综述】获取基于检测、分割、分类、曲线拟合等近几十篇学习论文！简介3D车道检测在自动驾驶轨控中起着至关重要的作用，最近成为自动驾驶领域一个快速发展的话题。之前的工作由于其复杂的空间转换模块和不灵活的三维车道表示很难真正在实际业务中应用。面对这些问题，本文提出了一个高效且简单

自动驾驶之心·2023-11-05 18:25

BERT-flow｜CMUx字节推出简单易用的文本表示新SOTA！

因为工作和个人信仰的关系，我一直比较关注文本表示的进展。召回是很多NLP系统中必备的一步，而向量化的召回比纯基于文字的离散召回效果更好更合理。同时文本表示还可以做很多事情，比如聚类、分类，不过更多地还是用在文本匹配上。2015年到18年间有很多优秀的文本表示模型，祭出宝图：但基于交互的匹配模型明显优于单纯的表示，再加上BERT出来，就很少有人再去研究了，2019年只有一个Sentence-BERT

李rumor·2023-11-05 17:30

打起来了~ 最小SOTA模型：Mistral 7B，各方面碾压LLaMA2 13B和LLaMA1 34B

深度学习自然语言处理分享MistralAI团队自豪地发布了Mistral7B，这是迄今为止尺寸最小的最强大的语言模型。进NLP群—>加入NLP交流群Mistral7B简介Mistral7B是一个73亿参数的模型，具有以下特点：在所有基准测试上优于Llama213B在许多基准测试上优于Llama134B在代码方面接近CodeLlama7B的性能，同时在英语任务上表现良好使用分组查询注意力（GQA）以

zenRRan·2023-11-04 16:21

Zero-shot RIS SOTA：Text Augmented Spatial-aware Zero-shot Referring Image Segmentation 论文阅读笔记

Zero-shotRISSOTA：TextAugmentedSpatial-awareZero-shotReferringImageSegmentation论文阅读笔记一、Abstract二、引言三、相关工作3.1Zero-shot分割3.2ReferringImageSegmentation3.3ImageCaptioning四、方法4.1总体框架4.2MaskProposal网络FreeSOL

乄洛尘·2023-11-04 04:03

【多模态】5、BLIP | 统一理解与生成任务为图像生成更高质量的文本描述

、方法2.1模型结构2.2Pre-trainingObjectives2.3CapFilt三、效果3.1训练细节3.2CapFilt的效果3.3样本多样性是文本合成器的关键3.4参数共享和解耦3.5和SOTA

呆呆的猫·2023-11-04 03:43

| 一款多 SOTA 模型集成的高级自动标注工具

框架介绍X-AnyLabeling是一款全新的交互式自动标注工具，其基于Labelme和Anylabeling等诸多优秀的标注工具框架进行构建，在此基础上扩展并支持了许多丰富的模型和功能，并借助SegmentAnything和YOLO系列等目前主流和经典的深度学习模型提供强大的AI能力支持。无须任何复杂配置，下载即用，大大降低用户使用成本，同时支持自定义模型和快捷键设置等，极大提升用户标注效率和使

CVHub·2023-11-03 23:28

采样提速256倍，蒸馏扩散模型生成图像质量媲美教师模型，只需4步

去噪扩散概率模型（DDPM）在图像生成、音频合成、分子生成和似然估计领域都已经实现了SOTA性能。

Evan-yzh·2023-11-03 10:00

提速256倍：蒸馏扩散模型，生成图像质量媲美教师模型，只需4步

深入浅出stablediffusion：AI作画技术背后的潜在扩散模型论文解读去噪扩散概率模型（DDPM）在图像生成、音频合成、分子生成和似然估计领域都已经实现了SOTA性能。

机器学习与AI生成创作·2023-11-03 10:55

ERNIE2.0背后的神助攻：飞桨高性能分布式训练引擎

最近，百度ERNIE再升级，发布持续学习语义理解框架ERNIE2.0，该模型在共计16个中英文任务上超越了BERT和XLNet，取得了SOTA效果。

飞桨PaddlePaddle·2023-11-02 07:48

像搭乐高一样做数学定理证明题，GPT-3.5证明成功率达新SOTA

©作者|机器之心编辑部来源|机器之心中山大学和华为等机构的研究者提出了LEGO-Prover，实现了数学定理的生成、整理、储存、检索和复用的全流程闭环。背景作为长链条严格推理的典范，数学推理被认为是衡量语言模型推理能力的重要基准，GSM8K和MATH等数学文字问题（mathwordproblem）数据集被广泛应用于语言模型的测评和比较中。事实上，数学作为一项科学研究并不仅仅包括计算具体实例，还包括

PaperWeekly·2023-11-02 05:04

RT-DERT：在实时目标检测上，DETRs打败了yolo

检测器的端到端速度3.1、NMS分析3.2、端到端速度基准测试4、实时DETR4.1、模型概述4.2、高效的混合编码器4.3、IoU-aware查询选择4.4、RT-DETR的缩放5、实验5.1、设置5.2、与SOTA

静静AI学堂·2023-11-01 23:46

标配率破8成，新能源车2025年全面标配！哪些OTA供应商正在领跑

伴随着汽车智能化的加速渗透，软件在线升级（OTA）也在快速实现从基于软件层的SOTA，到硬件层的FOTA的全面普及。

高工智能汽车·2023-11-01 12:27

opencv+yolov8实现监控画面报警功能

很快就可以跑完一天的视频用到的技术C++OpenCVYolov8+OnnxRuntimeyolov8介绍YOLOv8支持Pose和Segment,在使用TensorRT可以跑到1-2ms一帧YOLOv8提供了一个全新的SOTA

telllong·2023-11-01 07:42

[YoloV5修改]基于GnConv卷积模块的yolov5修改

2207.14284.pdfHorNet是在Swintransformer结构的基础上，结合大核思想提出的新的网络结构模块，使用该模块，作者在ImageNet-1k数据集上做分类，分割以及检测任务都在当时达到了SOTA

爱改网络的法式小面包·2023-11-01 04:57

YOLO算法改进3【中阶改进篇】：添加HorNet卷积模块

raoyongming/HorNet.HorNet是在Swintransformer结构的基础上，结合大核思想提出的新的网络结构模块，使用该模块，作者在ImageNet-1k数据集上做分类，分割以及检测任务都在当时达到了SOTA

梦在黎明破晓时啊·2023-11-01 04:54

BERT-as-service 时隔三年突然更新，这次连名儿都改了

无需担心复杂的实现细节，只需简单调用API，就可以为文本和图像创建SOTA表征向量。

Jina AI·2023-10-31 14:14

《Object Detection in 20 Years: A Survey》论文阅读笔记

5月16日，它回顾了1990年~2019年间的400多篇目标检测论文，涵盖了和这一领域相关的众多课题，如目标检测发展过程中的里程碑、目标检测数据集、评价指标、目标检测系统的基本模块、加速技术以及当前的SOTA

oneoverzero·2023-10-30 02:11

2023年MathorCup大数据竞赛赛道A：基于计算机视觉的坑洼道路检测和识别论文4

尽管如此，还是有一个缺乏关于最先进（SoTA）计算机视觉的系统调查文章为解决这些问题而开发的技术，尤其是深度学习模型问题。

Hello NiKo·2023-10-29 09:41

ModuleNotFoundError: No module named ‘mmcv._ext‘

mmsegmentation使用pyinstaller打包出现问题mmsegmentation是商汤开源的语义分割框架，里面包含了大量SOTA模型，十分适合从事语义分割工作的小白学习。

Trouble..·2023-10-28 15:49

医学影像乳腺肿瘤分割的同学看过来：PDPNet：用于通用乳腺肿瘤分割的渐进式双先验网络

PDPNet：一种渐进式双先验网络，可以来从动态增强的图像中分割乳腺肿瘤，性能表现SOTA！

xuxu1116·2023-10-28 11:59

[论文阅读]VirConv(KITTI SOTA 2023.10.17)——用于多模态 3D 目标检测的虚拟稀疏卷积

VirConvVirtualSparseConvolutionforMultimodal3DObjectDetection用于多模态3D目标检测的虚拟稀疏卷积论文网址：VirConv论文代码：VirConv简读论文这篇论文提出了一个称为VirConv的操作符,用于基于虚拟点的多模态3D对象检测。主要的贡献和创新点包括:提出了StochasticVoxelDiscard(StVD)机制,用于加速网络

一朵小红花HH·2023-10-27 07:06

FOTA与OTA区别在哪？

要远程升级的对象加在前面，FOTA(FirmwareOTA）、DOTA(DataOTA)、SOTA(SoftwareOTA）对了，你会发现没有HOTA(HardwareOTA）对吧？

a1809032425·2023-10-27 06:34

推荐频道

SOTA