E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
NeRF论文学习
DenseNet
论文学习
笔记
DenseNet
论文学习
笔记论文链接:DenselyConnectedConvolutionalNetworks图片来自论文受残差网络(ResNet)的启发,在较深的网络中使用shortcut来提高模型的准确率
shuyeah
·
2023-10-26 08:13
深度学习
提高CV模型训练性能的 9 个技巧
导读本文主要想分享一些可能有助于提高计算机视觉任务模型训练速度和准确性的一般技巧或建议,这些建议是通过课程、阅读顶级文章或
论文学习
所得来的。
冷冻工厂
·
2023-10-26 07:13
VALSE2023-快速总结
MaskedAutoencoders)2.4clip(ContrastiveLanguage-ImagePre-Training)模型2.5对比学习2.6扩散模型(diffustionmodel)2.7
Nerf
玉堃
·
2023-10-25 19:56
三维视觉
人工智能
经验分享
业界资讯
会议报告
论文学习
笔记(三) SGPN: Similarity Group Proposal Network for 3D Point Cloud Instance Segmentation
『写在前面』无意间看到了《深度学习在点云分割中的应用》干货总结,原视频为SGPN原作者的技术分享,便搜来仔细研读一番~SGPN是首个使用原始点云作为输入的实例分割网络,本篇blog为方便自己回忆要点用,建议参照原版paper使用。欢迎各位指正纰漏。论文出处:CVPR2018作者机构:WeiyueWang等,UniversityofSouthernCalifornia原文链接:https://arx
Wilber529
·
2023-10-25 19:22
#
PointCloud
点云分割
实例分割
深度学习
计算机视觉
PointNet
论文学习
笔记
PointNet
论文学习
笔记目前二维深度学习取得了很大的进步并且应用范围越来越广,随着三维设备的发展,三维深度学习得到了很大的关注。
程序猿小泽
·
2023-10-25 19:15
机器学习
PointNet
FoLR:Focus on Local Regions for Query-based Object Detection
论文学习
笔记
论文地址:https://arxiv.org/abs/2310.06470自从DETR问询式检测器首次亮相以来,基于查询的方法在目标检测中引起了广泛关注。然而,这些方法面临着收敛速度慢和性能亚优等挑战。值得注意的是,在目标检测中,自注意力机制经常因其全局聚焦而妨碍了收敛。为了解决这些问题,作者提出了FoLR,一种仅包含解码器的类似Transformer的架构。作者通过隔离不相关目标之间的连接来增强
athrunsunny
·
2023-10-25 13:21
深度学习笔记
1024程序员节
人工智能
深度学习
目标检测
计算机视觉
transformer
flash attention 2
论文学习
flashattention作者TriDao发布了flashattention2,性能为flashattention的2倍。优化点主要如下:一、减少non-matmulFLOPsA00中由于tensorcore的存在,使得gpu对于浮点矩阵运算吞吐很高,如FP16/BF16可以达到312TFLOPs/s,而对于非矩阵乘的浮点运算吞吐较低,如FP32只有19.5TFLOPs/s。因此作者调整算法以减
KIDGINBROOK
·
2023-10-22 13:13
cuda
gpu
cuda
医疗图像配准
论文学习
——AMnet(2023)自适应多级配准网络(
论文原文链接前言本文提出一种自适应多级配准网络(AMNet),以保持变形场的连续性,实现三维脑MR图像的高性能配准。首先,设计一种具有自适应增长策略的轻量级配准网络,从多级小波子带中学习变形场,便于全局和局部优化,实现高性能配准;其次,我们的AMNet设计用于图像配准,根据一个区域的变形复杂程度调整其局部重要性,从而提高配准效率并保持变形场的连续性。keyword:Deformableregist
研究僧_GUO
·
2023-10-22 12:29
python
pandas
机器学习
【三维重建】MobileR2L:轻量化移动端三维重建(CVPR2023)
文章目录摘要一、Introduction简介二、具体方法1.什么是
NeRF
2.什么是R2L3.MobileR2L的overview3.MobileR2L的网络结构三、实验1.数据集2.实现细节四、LimitationandConclusionNerf
杀生丸学AI
·
2023-10-21 06:51
三维重建与编辑
AIGC
人工智能
三维重建
3d
上交&微软 Make-it-3D:diffusion+
NeRF
从单张图像生成高保真的三维物体!
本文首发于微信公众号CVHub,未经授权不得以任何形式售卖或私自转载到其它平台,仅供学习,违者必究!Title:Make-It-3D:High-Fidelity3DCreationfromASingleImagewithDiffusionPriorPaper:https://arxiv.org/pdf/2303.14184.pdfCode:https://make-it-3d.github.io/
CVHub
·
2023-10-19 22:38
3D视觉
3d
计算机视觉
人工智能
HWGQ-Deep Learning with Low Precision by Half-wave Gaussian Quantization
论文学习
论文链接:https://openaccess.thecvf.com/content_cvpr_2017/html/Cai_Deep_Learning_With_CVPR_2017_paper.html摘要研究了深度神经网络激活的量化问题一直是研究热点。对流行的二值量子化方法的检验表明,它由一个经典的非线性,双曲切线:一个分段常数函数,用于前馈网络计算,以及一个分段线性硬阈值函数,用于网络学习过程
冰激凌很菜
·
2023-10-19 04:28
神经网络量化
深度学习
神经网络
【数字人】6、ER-
NeRF
| 借助空间分解来实现基于
NeRF
的更高效的数字人生成(ICCV2023)
文章目录一、背景二、方法2.1问题设定2.2Tri-PlaneHashRepresentation2.3RegionAttentionModule2.4训练细节三、效果3.1实验设定3.2定量对比3.3定性对比3.4Userstudy3.5消融实验四、代码4.1视频数据预处理4.2训练4.3推理论文:EfficientRegion-AwareNeuralRadianceFieldsforHigh-
呆呆的猫
·
2023-10-18 19:32
数字人
数字人
【数字人】4、AD-
NeRF
| 使用
NeRF
来实现从声音到数字人人脸的直接驱动(ICCV2021)
文章目录一、背景二、方法2.1适用于talkinghead的神经辐射场2.2使用辐射场来进行体渲染2.3独立
NeRF
表达三、效果论文:AD-
NeRF
:AudioDrivenNeuralRadianceFieldsforTalkingHeadSynthesis
呆呆的猫
·
2023-10-18 19:02
数字人
数字人
【数字人】5、RAD-
NeRF
| 通过解耦 audio-spatial 编码来实现基于
NeRF
的高效数字人合成
文章目录一、背景二、方法2.1问题定义2.2Decomposedaudio-spatialencodingmodule2.3Pseudo-3DDeformableModule用于控制torso2.4训练细节三、效果3.1实验设置3.2对比论文:Real-timeNeuralRadianceTalkingPortraitSynthesisviaAudio-spatialDecomposition代码
呆呆的猫
·
2023-10-18 19:01
数字人
数字人
ubuntu20.04
nerf
开山之作
源码GitHub-yenchenlin/
nerf
-pytorch:APyTorchimplementationofNeRF(NeuralRadianceFields)thatreproducestheresults
字梦笙
·
2023-10-18 14:18
三维重建
ubuntu
Nerf
学习笔记
Nerf
学习笔记Step1:相机Rays行进(raymarching)Step2:收集查询点Step3:将查询点投射到高维空间(位置编码)Step4:神经网络推理和体渲染神经网络推理体渲染计算损失Reference
泠山
·
2023-10-17 16:40
三维重建
学习
笔记
彻底搞懂
NeRF
论文公式代码
这周一直在死磕
nerf
,做个总结,代码主要是基于
Nerf
-pytorch,我愿称之为最好部署的nerfGitHub-yenchenlin/
nerf
-pytorch:APyTorchimplementationofNeRF
fisherisfish
·
2023-10-16 20:08
python
论文学习
——FALL-E:GAUDIO FOLEY SYNTHESIS SYSTEM
文章目录引言正文AbstractIntroduction介绍问题FALL-E2.1Architexture结构2.2TrainingandInferenceDetails3EvaluationAndAnalysis测试和分析Conlusion总结引言这篇文章是DCASE中少有的,没有使用DIffusion的方法,可以学习一下。这篇文章的作者GAUDIO公司,也是提出这个比赛的参与者。正文Abstr
客院载论
·
2023-10-16 10:00
音频生成
学习
人工智能
大模型 Dalle2 学习三部曲(三)Hierarchical Text-ConditionalImage Generation with CLIP Latents
论文学习
前言:今天我们来学习一下Dalle2论文上篇文章我们说latencydiffusion把图像和文本先压缩到隐空间再进行diffusion,大大提升了diffusion过程的效率,其实我们想想diffusion过程其实我们也完全没必要一直扩散到纯噪声再还原为图像,我们只需要扩散到适合我们生成图像的时候就可以。正所谓好钢用在刀刃上,效果好费时的扩散过程我们只要在关键位置使用就可以,即达到效果,又节省了
Pillars-Creation
·
2023-10-16 08:49
人工智能
AIGC
DALL·E
2
语言模型
[23] IPDreamer: Appearance-Controllable 3D Object Generation with Image Prompts
在NeRFTraining阶段,IPDreamer根据文本用ControlNet生成参考图,并将参考图作为Zero1-to-3的控制条件,用基于Zero1-to-3的SDS损失生成粗
NeRF
。
zzl_1998
·
2023-10-15 16:25
3d
论文学习
——Class-Conditioned Latent Diffusion Model For DCASE 2023
文章目录引言正文AbstractIntroductionSystemOverview2.1LatentDiffusionwithsound-class-basedconditioning以声音类别为条件的潜在扩散模型2.2VariationalAutoencoderandneuralvocoder变分自编码器和神经声码器FAD-orientedPostprocessingfilter(专门针对FA
客院载论
·
2023-10-15 12:24
音频生成
学习
人工智能
深度学习
GO-SLAM——论文简析
基于
NeRF
的视觉SLAM可以在小尺度场景中
gongyuandaye
·
2023-10-14 21:54
slam
深度学习
神经网络
Generalizable
NeRF
in ICCV‘23
文章目录前置知识Generalizable《EnhancingNeRFakintoEnhancingLLMs:GeneralizableNeRFTransformerwithMixture-of-View-Experts》《WaveNeRF:Wavelet-basedGeneralizableNeuralRadianceFields》NeO360:NeuralFieldsforSparseView
Iron_lyk
·
2023-10-14 16:54
论文阅读笔记
人工智能
计算机视觉
深度学习
ubuntu20.04
nerf
Instant-ngp (下) 复现,自建数据集,导出mesh
参考链接Ubuntu20.04复现instant-ngp,自建数据集,导出mesh_XINYUW的博客-CSDN博客GitHub-NVlabs/instant-ngp:Instantneuralgraphicsprimitives:lightningfastNeRFandmoreyoutube上的一个博主自建数据集https://www.youtube.com/watch?v=VsFHX8IgX1
字梦笙
·
2023-10-13 16:16
三维重建
三维重建
nerf
ubuntu20.04
nerf
Instant-ngp
Instant-ngplinuxubuntu20.04GPURTX3050TiInstant-ngp官方文档地址https://github.com/NVlabs/instant-ngp参考链接Instant-ngplinux部署及使用-简书Ubuntu20.04复现instant-ngp,自建数据集,导出mesh_XINYUW的博客-CSDN博客步骤安装基本依赖sudoapt-getinstal
字梦笙
·
2023-10-13 16:08
三维重建
三维重建
nerf
图像分割
论文学习
小记录1——FastInst(CVPR23)
图像分割
论文学习
小记录1——FastInst(CVPR23)目录图像分割
论文学习
小记录1——FastInst(CVPR23)学习前言:什么是FastInst研究背景与意义研究意义贡献网络结构分析LightweightpixeldecoderInstanceactivation-guidedqueriesGroundtruthmask-guidedlearningLossfunction
。 7.
·
2023-10-13 05:13
图像分割
学习
深度学习
数字人解决方案——ER-
NeRF
实时对话数字人模型训练与项目部署
前言1、算法概述ER-
NeRF
是基于
NeRF
用于生成数字人的方法,可以达到实时生成的效果。
知来者逆
·
2023-10-11 14:59
数字人
人工智能
NERF
ER-NERF
实时对话数字人
数字人
数字人直播
【论文合集】Awesome Video Diffusion
Acuratedlistofrecentdiffusionmodelsforvideogeneration,editing,restoration,understanding,
nerf
,etc.来源:https
m0_61899108
·
2023-10-11 04:36
知识学习系列
论文笔记
人工智能
diffusion
机器学习
深度学习
【软件装配】Windows配置conda虚拟环境以及下载.sh数据
文章目录1.git克隆到本地2.虚拟环境2.1.yml环境2.2下载数据集Windows配置conda虚拟环境以及下载.sh数据以
NeRF
为例
NeRF
:神经辐射场-官方实现代码1.git克隆到本地#GitBash
小白有颗大白梦
·
2023-10-10 23:53
软件装配
windows
conda
【CVPR 2022】Deblur-
NeRF
: Neural Radiance Fields from Blurry Images
Deblur-
NeRF
:NeuralRadianceFieldsfromBlurryImages论文简介:论文介绍:具体实现:基本概念实现细节DeformableSparseKernelConvolutionwithIrradianceOptimizingtheRayOriginAligningtheNeRF
BIT可达鸭
·
2023-10-10 11:45
NeRF
人工智能
计算机视觉
机器学习
3d
NeRF
NeRF
必读:Mip-
NeRF
总结与公式推导
前言
NeRF
从2020年发展至今,仅仅三年时间,而Follow的工作已呈井喷之势,相信在不久的将来,
NeRF
会一举重塑三维重建这个业界,甚至重建我们的四维世界(开头先吹一波)。
Rick0xFFFFFF
·
2023-10-10 11:45
人工智能
深度学习
Text-to-3D 任务论文笔记: Latent
NeRF
文章目录概述相关工作3D形状合成使用2D监督的text-to-3D任务方法前置知识LDMScoreDistillationLatentNeRF文本引导RGBrefinementSketch-ShapeGuidance对于显式形状的Latent-Paint实验实验细节文本引导的生成RGBRefinementTextual-InversionSketch-ShapeGuidanceLatent-Pai
FLOWVERSE
·
2023-10-10 11:14
论文阅读
计算机视觉
深度学习
人工智能
Block-
NeRF
Block-
NeRF
:ScalableLargeSceneNeuralViewSynthesis:可扩展的大场景神经视图合成摘要:论文中证明了在缩放
NeRF
以渲染跨越多个块的城市规模场景时,将场景分解为单独训练的
川河w
·
2023-10-10 11:14
NERF系列
计算机视觉
人工智能
数码相机
3D 生成重建005-
NeRF
席卷3D的表达形式
3D生成重建005-
NeRF
席卷3D的表达形式文章目录0论文工作1论文方法1.1体渲染1.2离散积分1.3位置编码1.4分层采样1.5影响2效果0论文工作
NeRF
(神经辐射场技术)最早2020年提出用于新视图合成任务
小熊bdg
·
2023-10-10 11:44
3d
计算机视觉
人工智能
UniAD
论文学习
一、解决了什么问题?当前的自动驾驶方案大致由感知(检测、跟踪、建图)、预测(motion、occupancy)和规划三个模块构成。为了实现各种功能,智驾方案大致包括两种路线。一种是针对每个任务都部署一个模型,该范式能降低各团队间的研发困难度,但由于各个优化目标是孤立的,会引发模块之间信息丢失、错误累加和特征不对齐的问题。另一种是多任务的设计路线,多个任务heads共享一个特征提取器,该范式能节省边
calvinpaean
·
2023-10-09 16:52
BEV
and
occupancy
学习
神经辐射场(
NeRF
)中-相机参数与坐标系变换
NeRF
:RepresentingScenesasNeuralRadianceFieldsforViewSynthesis是一篇获得ECCV2020BestPaperHonorableMention的论文
zaf赵
·
2023-10-07 20:26
数码相机
[TVCG-23]
NeRF
-Art: Text-Driven Neural Radiance Fields Stylization
提出系列基于CLIP的风格化损失目录Text-GuidedNeRFStylizationTrajectoryContrlw/DirectionalCLIPLossStrengthControlw/GlobalContrastiveLearningArtifactSuppressionw/WeightRegularizationTraining实验Text-GuidedNeRFStylization
zzl_1998
·
2023-10-07 05:19
深度学习
机器学习
人工智能
NeRF
风格化
Stable Diffusion:High-Resolution Image Synthesis with Latent Diffusion Models
论文学习
https://github.com/CompVis/latent-diffusion1摘要前一篇Diffusion算法明显的缺点是耗费大量的时间、计算资源,为此,论文将其应用于强大的预训练自编码器的潜在空间,这是首次允许在复杂性降低和细节保存之间达到一个近乎最佳的点,极大地提高了视觉保真度。通过在模型架构中引入交叉注意层,将扩散模型转化为强大而灵活的生成器,用于一般条件输入,如文本或包围框,并以
south020
·
2023-10-04 22:38
stable
diffusion
学习
SG Former
论文学习
笔记
超越SWin和CSWinTransformer的新模型代码地址:https://github.com/OliverRensu/SG-Former论文地址:https://arxiv.org/pdf/2308.12216.pdfViT在各种视觉任务中虽然成功,但它的计算成本随着Token序列长度的增加呈二次增长,这在处理大型特征图时大大限制了其性能。为了减轻计算成本,先前的研究依赖于要么限制在局部小
athrunsunny
·
2023-10-03 19:44
深度学习笔记
学习
笔记
计算机视觉
人工智能
深度学习
他们走过的路,是万里江山,满目烟尘|感恩日记D268
早起学习教师资格复习,早饭完毕,教研室
论文学习
。今天做了走路冥想,感觉特别舒服,特别神奇。和感恩日记带给我的魔力一样,让我更加慢下来,享受被自己忽略的周遭。能让自己慢下来是种
Amy宝宝
·
2023-10-03 02:44
[目标检测]——YOLO
论文学习
(v1)
论文提取链接:链接:https://pan.baidu.com/s/1LqNBgL9Va4puiDEljp9syg提取码:visfYOLO设计之初:就希望网络比较迅速,做到实时处理(你仅看一眼)——OneStage网络1、摘要和介绍:YOLO是做目标检测的,通过回归来做到这一点,即把一个端到端的网络设计成一个回归器2、UnifiedDetection:此节须知:需要知道的是YOLOV1版本想要预测
Star星屹程序设计
·
2023-10-01 01:02
计算机视觉
ByteTrack
论文学习
1.解决了什么问题?多目标跟踪是在给定的视频片段中,预测出目标的边框和ID信息。现有方法需要在truepositives和falsepositives之间做取舍,将高于一定阈值的检测框关联起来,获取其ID。而那些低得分的目标(如被遮挡物体)会被舍弃,造成一些真实目标丢失、轨迹断断续续的问题。如下图,在t1t_1t1帧初始化了三个不同的tracklets,其得分高于0.50.50.5。但在t2t_2
calvinpaean
·
2023-09-30 19:27
多目标追踪
学习
FairMOT
论文学习
1.解决了什么问题?现有的多目标跟踪方案将目标检测和reID任务放在一个网络里面优化学习,计算效率高。目标检测首先在每一帧中检测出兴趣目标,要么将其与现有的轨迹关联起来,要么创建一个新的轨迹。这两个任务会相互竞争,现有的方法都将reID任务列为次优先级任务,而检测任务为主优先级,reID的准确率受检测影响很大,这对reID不公平。当场景中目标很多时,先检测再跟踪的方式无法取得实时的效果,因为这两个
calvinpaean
·
2023-09-30 18:18
多目标追踪
学习
目标跟踪
人工智能
论文学习
:RT-DETR
RT-DETR摘要DETR取得显著性能,但高成本计算使其无法发挥无NMS的优势,无法实际应用。本文分析了NMS对准确性和速度的负面影响,并建立端到端的速度基准。第一个实时端到端检测器,高效处理多尺度特征,并提出IoU-awarequeryselection,向解码器提供了更高质量的初始objectqueries可以灵活调整解码器层数来调整推理速度,不需要重新训练。速度和精度都优于相同规模最先进的Y
Plusmile1
·
2023-09-30 16:54
学习
神经辐射场(
NeRF
)2023最新论文及源代码合集
神经辐射场(
NeRF
)作为一种先进的计算机图形学技术,能够生成高质量的三维重建模型,在计算机图形学、计算机视觉、增强现实等领域都有着广泛的应用前景,因此,自2020年惊艳亮相后,神经辐射场也成为了人工智能领域的热门研究方向
深度之眼
·
2023-09-29 20:44
人工智能干货
深度学习干货
神经辐射场
【
论文学习
】Document-Level Relation Extraction with Adaptive Focal Loss and Knowledge Distillation
文章目录摘要1.导言2.方法论2.1问题制定2.2模型架构2.2.1特征表示学习实体表示context-enhanced实体表示实体对表示轴向注意力加强的实体对表示2.2.2适应性焦距损失(AdaptiveFocalLoss)2.2.3KnowledgeDistillationforDistantSupervisionNaiveAdaptation(NA)KnowledgeDistillation
Shackles Lay
·
2023-09-29 16:43
学习
深度学习
人工智能
nlp
三维重建
论文学习
开源的三维重建算法的介绍、比较和评估最近接触稠密重建,跑了几个开源框架,看了下重建的效果。想深入了解框架相关算法和效果比较。于是找到了这篇文章:OPEN-SOURCEIMAGE-BASED3DRECONSTRUCTIONPIPELINES:REVIEW,COMPARISONANDEVALUATION开源项目VisualSfM是最早使用一体GUI的开源工具,该工具由Wu等人开发,并整合了著名的PMV
unicorn_lyc
·
2023-09-28 04:46
colmap
自动驾驶
Improved Baselines with Momentum Contrastive Learning
论文学习
1.解决了什么问题?最近的非监督表征学习关注在对比学习上。在检测和分割任务上,MoCo的非监督预训练表现优于在ImageNet监督预训练的表现;在线性分类表现上,SimCLR进一步缩小了非监督和监督预训练的差距。2.提出了什么方法?使用一个MLP映射head和数据增强方法,改进了MoCo。这两个方法与现有的MoCo和SimCLR框架是正交的,能提升MoCo在图像分类和目标检测上迁移学习的效果。此外
calvinpaean
·
2023-09-27 04:21
度量学习
学习
人工智能
[
论文学习
]P-Tuning v2: Prompt Tuning Can Be Comparable to Fine-tuning Universally Across Scales and Task
[
论文学习
]P-TuningV2P-Tuningv2:PromptTuningCanBeComparabletoFine-tuningUniversallyAcrossScalesandTasksP-Tuningv2
simpsun
·
2023-09-26 23:44
NLP论文笔记
深度学习
自然语言处理
Momentum Contrast for Unsupervised Visual Representation Learning
论文学习
1.解决了什么问题?非监督学习在自然语言处理非常成功,如GPT和BERT。但在计算机视觉任务上,监督预训练方法要领先于非监督的方法。这种差异可能是因为各自的信号空间不同,语言任务有着离散的信号空间(单词、短语等)来构建非监督学习所需的字典。而计算机视觉则很难构建一个字典,因为原始信号位于连续的高维空间,不像单词一样是结构化的。最近的非监督表征学习方法使用对比损失取得了不错的效果,它们基本是构建了一
calvinpaean
·
2023-09-26 23:27
度量学习
学习
easyui
前端
上一页
2
3
4
5
6
7
8
9
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他