E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
SOTA
[论文阅读]VirConv(KITTI
SOTA
2023.10.17)——用于多模态 3D 目标检测的虚拟稀疏卷积
VirConvVirtualSparseConvolutionforMultimodal3DObjectDetection用于多模态3D目标检测的虚拟稀疏卷积论文网址:VirConv论文代码:VirConv简读论文这篇论文提出了一个称为VirConv的操作符,用于基于虚拟点的多模态3D对象检测。主要的贡献和创新点包括:提出了StochasticVoxelDiscard(StVD)机制,用于加速网络
一朵小红花HH
·
2023-10-27 07:06
多模态三维目标检测
基于点云的三维目标检测
论文阅读
3d
目标检测
计算机视觉
人工智能
FOTA与OTA区别在哪?
要远程升级的对象加在前面,FOTA(FirmwareOTA)、DOTA(DataOTA)、
SOTA
(SoftwareOTA)对了,你会发现没有HOTA(HardwareOTA)对吧?
a1809032425
·
2023-10-27 06:34
网络通信学习
计算机名词学习
文生视频领域
SOTA
工作 Show-1:论文和代码解读
DiffusionModels视频生成-博客汇总前言:最近的text-to-video的论文Show-1在MSR-VTT测评数据集上取得了FVD和CLIPSIM指标上的第一名,FID指标上的第二名。采用混合模型的方法,结合了基于像素的VDM和基于潜在空间的VDM进行文本到视频的生成,不仅能取得很高的生成指标,还能大大降低推理资源消耗。这篇博客详细解读一下这篇论文和代码。目录贡献概述方法详解
沉迷单车的追风少年
·
2023-10-26 08:30
Diffusion
Models与深度学习
1024程序员节
视频生成
扩散模型
视频编辑
CLIP系列:CLIP:沟通文本和图像的桥梁
SOTA
的视觉任务模型需要固定的监督数据对,比如-大象,-兔子。这种方式在特定数据集上能够拥有很好的性能,但是在其他未知类别上的性能就会急剧下降。
yumaomi
·
2023-10-25 17:47
人工智能
深度学习
机器学习
探索图像分割技术:使用 OpenCV 的分水岭算法
这将是一系列三篇博客文章,深入研究三种不同的图像分割技术-1使用OpenCV的经典分水岭算法,2使用PyTorch实现的基于深度学习的UNet模型,3
SOTA
图像分割模型。
无水先生
·
2023-10-25 02:49
数字图形和图像处理
人工智能
opencv
算法
人工智能
抛弃注意力,比EfficientNet快3.5倍,类Transformer新模型跨界视觉任务实现新
SOTA
本文经机器之心(almosthuman2014)授权转载,禁止二次转载.选自OpenReview机器之心编译机器之心编辑部Transformer用在图像识别上会存在计算效率过低的挑战,最近一篇向ICLR2021大会提交的论文似乎很好地解决了这一问题,其研究的PyTorch代码也已在GitHub上开源。在自然语言处理领域(NLP)成为重要力量的Transformer技术最近已经开始在计算机视觉领域展
我爱计算机视觉
·
2023-10-24 17:31
python
计算机视觉
机器学习
深度学习
人工智能
小白看得懂的 Transformer (图解)
1.导语谷歌推出的BERT模型在11项NLP任务中夺得
SOTA
结果,引爆了整个NLP界。而BERT取得成功的一个关键因素是Transformer的强大作用。
逍遥自在017
·
2023-10-24 03:18
深度学习
transformer
深度学习
人工智能
attention
自然语言处理---Transformer机制详解之BERT模型介绍
BidirectionalEncoderRepresentationfromTransformers.BERT在机器阅读理解顶级水平测试SQuAD1.1中表现出惊人的成绩:全部两个衡量指标上全面超越人类,并且在11种不同NLP测试中创出
SOTA
lichunericli
·
2023-10-23 11:58
自然语言处理
自然语言处理
transformer
人工智能
自然语言处理---huggingface平台使用指南
Huggingface一直致力于自然语言处理NLP技术的平民化(democratize),希望每个人都能用上最先进(
SOTA
,state-of-the-art)的NLP技术,而非困窘于训练资源的匮
lichunericli
·
2023-10-22 12:47
自然语言处理
自然语言处理
rnn
人工智能
【AIGC核心技术剖析】大型语言和视觉助手——LLaVA(论文+源码)
LLaVA-1.5在11个基准测试上实现了
SoTA
,只需对原始LLaVA进行简单的修改,利用所有公共数据,在单个1-A8节点上在~100天内完成训练,并超越使用数十亿级数据的方法。
源代码杀手
·
2023-10-22 03:52
AIGC核心技术剖析
AIGC
Paper Reading:《Consistent-Teacher: 减少半监督目标检测中不一致的伪目标》
目录简介工作重点方法ASA,adaptiveanchorassignmentFAM-3D,3DfeaturealignmentmoduleGMM,GaussianMixtureModel实施细节实验与
SOTA
热水过敏
·
2023-10-21 21:57
Paper
Reading
目标检测
人工智能
计算机视觉
笔记
图像处理
论文阅读
Parameter-efficient transfer learning系列之LoRA与BitFit
目前大规模语言模型在诸多任务上取得
sota
效果,Finetune全模型参数以适配下游任务虽然能取得不错的效果,但是却是一种低效的参数更新方式,归因于模型的庞大模型参数量带来的训练成本,从而限制了在诸多下游任务的应用
zenRRan
·
2023-10-21 18:46
nuScenes
SOTA
!SurroundOcc:面向自动驾驶的纯视觉3D占据预测网络(清华&天大)
最近,多相机三维占据预测(3DOccupancyPrediction)受到了广泛关注。作为自动驾驶中的基石任务,三维目标检测天然存在无法识别任意形状以类别的物体。相较于三维目标检测,三维占据预测可以对周围环境进行稠密重建,从而更好地进行感知。本文提出SurroundOcc方法,我们利用多帧稀疏LiDAR点云自动生成稠密三维占据标签,并以此作为监督信号训练得到基于多相机图像的稠密占据预测网络。相关代
自动驾驶之心
·
2023-10-21 14:29
自动驾驶
3d
计算机视觉
人工智能
深度学习
Transformer模型 | Transformer模型描述
谷歌推出的BERT模型在11项NLP任务中夺得
SOTA
结果,引爆了整个NLP界。而BERT取得成功的一个关键因素是Transformer的强大作用。
算法如诗
·
2023-10-21 07:23
Transformer模型
transformer
深度学习
人工智能
MSRA+北大全华班「女娲」模型怒刷8项
SOTA
,完虐OpenAI DALL-E...
视学算法报道编辑:好困小咸鱼LRS【新智元导读】微软亚洲研究院、北京大学强强联合提出了一个可以同时覆盖语言、图像和视频的统一多模态预训练模型——NÜWA(女娲),直接包揽8项
SOTA
。
视学算法
·
2023-10-20 19:40
计算机视觉
机器学习
人工智能
深度学习
自然语言处理
一个模型通杀8大视觉任务,图像、视频生成大一统!MSRA+北大全华班「女娲」模型...
微软亚洲研究院、北京大学强强联合提出了一个可以同时覆盖语言、图像和视频的统一多模态预训练模型——NÜWA(女娲),包揽8项
SOTA
,完虐OpenAIDALL-E!照着文字「脑补」图像居然都不稀奇了!
深度学习技术前沿
·
2023-10-20 19:07
计算机视觉
机器学习
人工智能
深度学习
编程语言
论文《Learning to Recover 3D Scene Shape from a Single Image》解读
动机:虽然目前单张图像深度重建任务有了长足的进步,但是即使是
SOTA
的方法依然无法用这些深度图重建出准确的三维形状。原因在
Pokman
·
2023-10-20 17:16
发现一篇专门吐槽 NLP 内卷现状的 ACL 论文 ...
在发论文的时候,又要不断地去内卷
SOTA
,今天的
SOTA
在明天就有可能被打败,成为了过眼云烟。极端情况下,某一篇论文正在撰写,ArXiv上就突然刷新了
SOTA
,又足以让研究者们头疼应该
夕小瑶
·
2023-10-18 13:03
大数据
编程语言
机器学习
人工智能
深度学习
Learning Deep Convolutional Networks for Demosaicing
在使用拜耳滤色器阵列(CFA)的情况下,对流行基准的评估证实CNN模型的数据驱动、自动学习特征非常有效,并且我们提出的最佳CNN模型优于当前的
SOTA
算法。
Adagrad
·
2023-10-18 09:56
paper
ISP
DeBayer
深度学习
CornerNet:经典keypoint-based方法,通过定位角点进行目标检测 | ECCV2018
论文提出了CornerNet,通过检测角点对的方式进行目标检测,与当前的
SOTA
检测模型有相当的性能。
VincentTeddy
·
2023-10-18 08:17
YourTTS: Towards Zero-Shot Multi-Speaker TTS and Zero-Shot VoiceConversion for everyone论文阅读
在零样本多说话人TTS中取得了最先进的(
SOTA
)结果,在VCTK数据集上的零样本语音转换结果与
SOTA
相当。该方法在单说话人数据集的目标语言中取得了很好的结果,为低资源语言的零样本多说话人TTS和零
别和我卷!
·
2023-10-17 21:42
论文笔记
论文阅读
语音识别
人工智能
transformer
AudioLM
embedding
AIGC
XLNet
PermutationLanguageModeling2.Two-StreamSelf-Attention3.Transformer-XL0.XLNet简介2018年Bert横空出世,刷新了很多NLP任务的
SOTA
雪糕遇上夏天
·
2023-10-17 15:32
NLP
神经网络
深度学习
xlnet
自然语言处理
人工智能
EMNLP 2023 录用论文公布,速看NLP各领域最新
SOTA
方案
EMNLP2023近日公布了录用论文。开始前以防有同学不了解这个会议,先简单介绍介绍:EMNLP是NLP四大顶会之一,ACL大家应该都很熟吧,EMNLP就是由ACL下属的SIGDAT小组主办的NLP领域顶级国际会议,一年举办一次。相较于ACL,EMNLP更偏向于NLP在各个领域解决方案的学术探讨。今年的EMNLP2023大会将于12月6日-10日在新加坡召开,我先整理了10篇录用论文来和大家分享,
深度之眼
·
2023-10-17 00:40
深度学习干货
人工智能干货
机器学习
人工智能
自然语言处理
EMNLP
#今日论文推荐#DeepMind谷歌研究员力荐:扩散模型效率&生成质量提升窍门,来自StyleGAN原作者
来自英伟达StyleGAN的原班作者们站了出来,尝试给出了一些设计扩散模型的窍门和准则,结果模型的质量和效率都有所改进,比如将现有ImageNet-64模型的FID分数从2.07提高到接近
SOTA
的1.55
wwwsxn
·
2023-10-16 12:04
深度学习
transformer
深度学习
计算机视觉
一文读懂扩散模型原理、推断加速和可控生成
来源:智源社区整理:熊宇轩在刚刚过去的2022年,扩散模型(DiffusionModels)成为了深度生成模型中新的
SOTA
。
人工智能学家
·
2023-10-16 12:27
漫谈自动驾驶-自动驾驶最新的技术栈有哪些,一文讲清楚
简要介绍2.1自动化水平2.2硬件2.3软件3感知4轨迹预测5建图6定位7规划8控制9V2X10仿真11安全性12数据闭环12.1数据选择12.2数据标注12.3主动学习13结论13.1ChatGPT和
SOTA
林聪木
·
2023-10-15 07:31
自动驾驶
人工智能
机器学习
文本匹配SimCSE模型代码详解以及训练自己的中文数据集
但是该示例代码中的短文本是用的英文短句,其实SimCSE模型也可以用于中文短文本的特征提取,本篇博客就基于苏沐剑发表于科学空间的中文任务还是
SOTA
吗?
肥宅程序员aka不会游泳的鱼
·
2023-10-15 06:23
人工智能
深度学习
互联网摸鱼日报(2023-10-13)
气泡酒;永辉进军“正品折扣店”;贝壳斥资15.5亿进军家装|品牌日报年度「焦点」产品计划重磅启动,快来pick你心中的年度优秀产品吧早期的欲望与后期的热爱,很多事儿没那么难陈丹琦团队新作:5%成本拿下
SOTA
每日摸鱼大王
·
2023-10-15 01:30
每日摸鱼新闻
业界资讯
提速256倍,斯坦福&谷歌提出扩散模型蒸馏方法,效果接近Teacher
去噪扩散概率模型(DDPM)在图像生成、音频合成、分子生成和似然估计领域都已经实现了
SOTA
性能。
夕小瑶
·
2023-10-14 23:18
深度学习
人工智能
机器学习
计算机视觉
神经网络
GPT-4最新使用体验:普通任务版
OpenAI表示GPT-4大大优于现有的大型语言模型、以及大多数下一代(
SOTA
,StateOfTheArts)模型。OpenAI创始人SamA
小蜜蜂助手Beezy
·
2023-10-14 20:49
Beezy测评
gpt-3
chatgpt
初级问题 程序中的变量是指什么?中级问题 把若干个数据沿直线排列起来的数据结构叫作什么?高级问题 栈和队列的区别是什么?
计算机图形学(有效边表算法)介绍一下计算机图形学中的补色原理考核制度决定了成败区域填充算法介绍一下
SOTA
自然界中的反物质哈尔滨工业大学卓越工程师学院2024年产教融合培养项目(郑州)专业学位硕士研究生招生简介
盛溪的猫猫
·
2023-10-14 13:29
感悟
人工智能
大数据
物联网
使用GluonCV+OpenCV+YoloV3调用摄像头实现实时人脸检测
1.写在前面最近组里有个项目与目标识别有关,去网上找了一下,发现目前
SOTA
的目标识别算法基本都是one-stage的,比如SSD、DSSD、RetinaNet、YOLO等,但是速度上YOLO是最快的。
Maplect
·
2023-10-13 18:40
达摩远最新 | FastInst:实例分割新
SOTA
,又快又好!
作者|小书童编辑|集智书童点击下方卡片,关注“自动驾驶之心”公众号ADAS巨卷干货,即可获取点击进入→自动驾驶之心【语义分割】技术交流群后台回复【分割综述】获取语义分割、实例分割、全景分割、弱监督分割等超全学习资料!最近对实例分割的关注集中在基于查询的模型上。尽管这些模型是无非最大值抑制(NMS)和端到端的,但在高精度实时基准测试上的优势尚未得到很好的证明。在本文中展示了基于查询的模型在高效实例分
自动驾驶之心
·
2023-10-13 05:09
深度学习
计算机视觉
人工智能
YOLOv7改进策略:RIFormerBlock助力检测|CVPR2023 RIFormer:无需TokenMixer也能达成
SOTA
性能的极简ViT架构
本文属于原创独家改进:稀疏重参数RIFormerBlock模型引入YOLOv7进行创新性RIFormerBlock|亲测在多个数据集实现涨点;收录:YOLOv7高阶自研专栏介绍:http://t.csdnimg.cn/tYI0c✨✨✨前沿最新计算机顶会复现YOLOv7自研创新结合,轻松搞定科研持续更新中,定期更新不同数据集涨点情况1.RIFormer介绍论文:https://arxiv.org/p
AI小怪兽
·
2023-10-12 21:02
YOLOv7高阶自研
YOLO
架构
目标检测
人工智能
计算机视觉
python
【文献阅读笔记】M2MRF: Many-to-Many Reassembly of Features for Tiny Lesion Segmentation in Fundus Images
3.2.1.模块概述3.2.2.M2MRF3.2.3.用于微小病变分割的M2MRF4.实验和讨论4.1.实施细节4.1.1.数据集和增强4.1.2.实验设置4.2.IDRiD数据集上的结果4.2.1.与
SOTA
Cpdr
·
2023-10-12 06:55
论文阅读
学习方法
论文阅读
论文笔记
CSwin Transformer 学习笔记
Cswin提出了上图中使用交叉形状局部attention,为了解决VIT模型中局部自注意力感受野进一步增长受限的问题,同时提出了局部增强位置编码模块,超越了Swin等模型,在多个任务上效果
SOTA
(当时的
athrunsunny
·
2023-10-12 06:43
深度学习笔记
transformer
学习
笔记
深度学习
人工智能
计算机视觉
MutualNet: Adaptive ConvNet via MutualLearning from Network Width and Resolution文章精读
相对于目前
SOTA
的自适应网络US-Net,本文方法在ImageNet上取得了更高的top-1准确率,要比最优的复合尺度的MobileNet和EfficientNet高
ustcthebest
·
2023-10-11 17:57
图像识别
人工智能
达摩院CVPR2023人脸重建论文HRN解读——REALY榜单冠军模型
本文中,我们将介绍来自达摩院的CVPR2023最新的人脸重建论文,该工作在单图人脸重建榜单REALY上取得正脸、侧脸双榜第一,并在其他多个数据集中取得了
SOTA
的效果。
胖胖腐乳
·
2023-10-11 16:27
人脸重演
计算机视觉
人工智能
cv
Smaller, faster, cheaper, lighter: Introducing DistilBERT, a distilled version of BERT 翻译
github.com/huggingface/transformersTime:2019.10在过去的18个月中,在过去的18个月中,几乎所有的自然语言处理任务都从大型语言模型进行迁移学习这一方式达到了
SOTA
睡熊猛醒
·
2023-10-11 06:00
情感分析
语言模型
情感分析
预训练模型
知识蒸馏
目标识别项目实战:基于Yolov7-LPRNet的动态车牌目标识别算法模型(二)
按照官方描述,YOLOv8是一个
SOTA
模型,它建立在以前YOLO版本的成功基础上,并引入了新的功能和改进,以进一步提升性能和灵活性。
fanstuck
·
2023-10-07 12:56
YOLO
目标跟踪
计算机视觉
人工智能
目标检测
华为提出Gold-YOLO:实时目标检测新
SOTA
点击下方卡片,关注“CVer”公众号AI/CV重磅干货,第一时间送达点击进入—>【目标检测和Transformer】交流群作者:王云鹤(源:知乎,已授权)|编辑:CVer公众号https://zhuanlan.zhihu.com/p/657742732在CVer微信公众号后台回复:Gold,可以下载本论文pdf、代码Gold-YOLO:EfficientObjectDetectorviaGathe
Amusi(CVer)
·
2023-10-06 05:19
YOLO
目标检测
人工智能
计算机视觉
基于YOLOv8的安全帽检测系统(4):EMA基于跨空间学习的高效多尺度注意力、效果优于ECA、CBAM、CA,助力行为检测 | ICASSP2023
YOLOv8是一种尖端的、最先进的(
SOTA
)模型,它建立在先前YOLO成功基础上,并引入了新功能和改进,以进一步提升性能和灵活性。它可以在大型数据集上进行训练,并且能够在各种硬件平台上
AI小怪兽
·
2023-10-06 02:35
Yolov8成长师
人工智能
深度学习
YOLO
华为
学习
计算机视觉
目标检测
NUWA论文阅读
VisualSynthesisPre-trainingforNeuralvisUalWorldcreAtion文章目录摘要引言相关工作视觉自回归模型视觉稀疏自注意方法3D数据表征3DNearbySelf-Attention3D编码器-解码器训练目标实验实现细节与
SOTA
zzfive
·
2023-10-05 14:02
视频生成或编辑
论文阅读
超详细DeepLabv3 介绍与使用指南 – 使用 PyTorch 推理
当时,DeepLabv3在PascalVOC2012测试集上实现了最先进的(
SOTA
)性能,在著名的Cityscapes数据集上以及使用Google内部JFT数据集进行训练时,也取得了同等的
SOTA
结果
TD程序员
·
2023-10-05 14:32
深度学习开发实践系列
pytorch
人工智能
python
深度学习
目标检测
计算机视觉
【论文笔记】SparseFusion: Fusing Multi-Modal Sparse Representations for Multi-Sensor 3D Object Detection
相反,稀疏表达很高效且能达到
SotA
性能。通常,使用稀疏表达的方法使用物体查询表示物体或实例,并与原始图像和点云特征交互。 本文
byzy
·
2023-10-04 15:33
#
激光雷达与图像融合
目标检测
论文阅读
自动驾驶
深度学习
计算机视觉
多目标跟踪框架boxmot介绍
引言boxmot由mikelbrostrom开发,用于目标检测,分割和姿态估计模型的
SOTA
(stateofart)跟踪模块,现已加入python第三方库PYPI,可用pip包管理器进行安装。
王定邦
·
2023-10-04 12:00
目标跟踪
人工智能
计算机视觉
大规模语言模型--训练成本
目前,基于Transformers架构的大型语言模型(LLM),如GPT、T5和BERT,已经在各种自然语言处理(NLP)任务中取得了
SOTA
结果。
hanscalZheng
·
2023-10-03 23:20
大语言模型
语言模型
人工智能
自然语言处理
基于YOLOv8的安全帽检测系统(2):Gold-YOLO,遥遥领先,助力行为检测 | 华为诺亚NeurIPS23
YOLOv8是一种尖端的、最先进的(
SOTA
)模型,它建立在先前YOLO成功基础上,并引入了新功能和改进,以进一步提升性能和灵活性。它可以在大型数据集上进行训练,并且能够在各种硬件平台上运
AI小怪兽
·
2023-10-03 10:38
Yolov8成长师
人工智能
深度学习
计算机视觉
transformer
目标检测
YOLO
谷歌提出MAGE:图像分类和生成达到
SOTA
!
重磅干货,第一时间送达点击进入—>【计算机视觉】微信技术交流群转载自:机器之心在一篇CVPR2023论文中,来自MIT和谷歌的研究人员提出了一种全新的框架MAGE,同时在图像识别和生成两大任务上实现了
SOTA
Amusi(CVer)
·
2023-10-03 07:00
分类
人工智能
计算机视觉
深度学习
机器学习
1个模型横扫40+个
SOTA
!22位华人共同打造佛罗伦萨模型,一统图像视频文本,含9亿图像-文本对...
Florence可以轻松适用于各种计算机视觉任务,如分类、目标检测、VQA、看图说话、视频检索和动作识别,并在超过40个基准中刷新了
SOTA
。
我爱计算机视觉
·
2023-10-03 07:00
大数据
计算机视觉
机器学习
人工智能
深度学习
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他