E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
论文笔记——模型压缩
LLM大模型学习:LLM大模型推理加速
目录一、模型优化技术二、
模型压缩
技术三、硬件加速四、GPU加速五、模型并行化和分布式计算技术一、模型优化学习常见的模型优化技术,如模型剪枝、量化、分片、蒸馏等,掌握相应的实现方法。1.1剪枝
七七Seven~
·
2024-09-12 17:45
学习
人工智能
transformer
深度学习
llama
论文笔记
—NDT-Transformer: Large-Scale 3D Point Cloud Localization using the Normal Distribution Transfor
论文笔记
—NDT-Transformer:Large-Scale3DPointCloudLocalizationusingtheNormalDistributionTransformRepresentation
入门打工人
·
2024-09-10 03:09
笔记
slam
定位
算法
Python中的深度学习神经网络
构建与训练神经网络模型的步骤深度学习训练过程3.卷积神经网络的原理-卷积层与池化层-特征提取与全连接层-Python中的CNN库与工具4.Python中深度学习的挑战和未来发展方向-计算资源与速度-迁移学习与
模型压缩
2301_78297473
·
2024-09-07 08:46
深度学习
python
神经网络
模型剪枝综述
目录1深度神经网络的稀疏性:2剪枝算法分类:3具体的剪枝方法包括:4剪枝算法流程:5几种常见的剪枝算法:6结构化剪枝和非结构化剪枝各有其优缺点:7剪枝算法对模型精度的影响8影响剪枝算法对模型精度的因素
模型压缩
中的剪枝算法是一种应用广泛的
模型压缩
方法
发狂的小花
·
2024-09-06 23:20
人工智能
#
模型部署
深度学习
人工智能
模型部署
模型剪枝
性能优化
[
论文笔记
]Circle Loss: A Unified Perspective of Pair Similarity Optimization
引言为了理解CoSENT的loss,今天来读一下CircleLoss:AUnifiedPerspectiveofPairSimilarityOptimization。为了简单,下文中以翻译的口吻记录,比如替换"作者"为"我们"。这篇论文从对深度特征学习的成对相似度优化角度出发,旨在最大化同类之间的相似度sps_ps
愤怒的可乐
·
2024-09-05 07:18
#
文本匹配[论文]
论文翻译/笔记
自然语言处理
论文阅读
人工智能
图像处理之蒸馏
蒸馏什么是蒸馏蒸馏技术分类什么是轨迹一致性蒸馏(TCD)什么是蒸馏在图像处理领域,蒸馏是一种
模型压缩
和知识迁移的技术。
醉后才知酒浓
·
2024-09-04 15:13
面试题
OpenCV
图像处理
人工智能
计算机视觉
深度学习
【
论文笔记
】Multi-Task Learning as a Bargaining Game
Abstract本文将多任务学习中的梯度组合步骤视为一种讨价还价式博弈(bargaininggame),通过游戏,各个任务协商出共识梯度更新方向。在一定条件下,这种问题具有唯一解(NashBargainingSolution),可以作为多任务学习中的一种原则方法。本文提出Nash-MTL,推导了其收敛性的理论保证。1Introduction大部分MTL优化算法遵循一个通用方案。计算所有任务的梯度g
xhyu61
·
2024-09-03 09:26
机器学习
学习笔记
论文笔记
论文阅读
人工智能
深度学习
[
论文笔记
] LLaVA
一、LLaVA论文中的主要工作和实验结果ExistingGap:之前的大部分工作都在做模态对齐,做图片的representationlearning,而没有针对ChatBot(多轮对话,指令理解)这种场景优化。Contribution:这篇工作已经在BLIP-2之后了,所以Image的理解能力不是LLaVA希望提升的重点,LLaVA是想提升多模态模型的Instruction-Followingab
心心喵
·
2024-09-03 08:53
论文笔记
论文阅读
[
论文笔记
] LLM模型剪枝
AttentionIsAllYouNeedButYouDon’tNeedAllOfItForInferenceofLargeLanguageModelsLLaMA2在剪枝时,跳过ffn和跳过fulllayer的效果差不多。相比跳过ffn/fulllayer,跳过attentionlayer的影响会更小。跳过attentionlayer:7B/13B从100%参数剪枝到66%,平均指标只下降1.7~
心心喵
·
2024-09-03 08:53
论文笔记
论文阅读
剪枝
算法
【
论文笔记
】Training language models to follow instructions with human feedback B部分
TraininglanguagemodelstofollowinstructionswithhumanfeedbackB部分回顾一下第一代GPT-1:设计思路是“海量无标记文本进行无监督预训练+少量有标签文本有监督微调”范式;模型架构是基于Transformer的叠加解码器(掩码自注意力机制、残差、Layernorm);下游各种具体任务的适应是通过在模型架构的输出后增加线性权重WyW_{y}Wy实
Ctrl+Alt+L
·
2024-09-02 01:12
大模型论文整理
论文笔记
论文阅读
语言模型
人工智能
自然语言处理
【
论文笔记
】:LAYN:用于小目标检测的轻量级多尺度注意力YOLOv8网络
背景针对嵌入式设备对目标检测算法的需求,大多数主流目标检测框架目前缺乏针对小目标的具体改进,然后提出的一种轻量级多尺度注意力YOLOv8小目标检测算法。小目标检测精度低的原因随着网络在训练过程中的加深,检测到的目标容易丢失边缘信息和灰度信息等。获得高级语义信息也较少,图像中可能存在一些噪声信息,误导训练网络学习不正确的特征。映射到原始图像的感受野的大小。当感受野相对较小时,空间结构特征保留较多,但
hhhhhhkkkyyy
·
2024-09-01 10:39
论文阅读
目标检测
YOLO
激光SLAM--(8) LeGO-LOAM
论文笔记
论文标题:LeGO-LOAM:LightweightandGround-OptimizedLidarOdometryandMappingonVariableTerrain应用在可变地形场景的轻量级的、并利用地面优化的LOAMABSTRACT轻量级的、基于地面优化的LOAM实时进行六自由度位姿估计,应用在地面的车辆上。强调应用在地面车辆上是因为在这里面要求雷达必须水平安装,而像LOAM和LIO-SA
lonely-stone
·
2024-08-30 20:29
slam
激光SLAM
论文阅读
英伟达如何通过剪枝和蒸馏技术让Llama 3.1模型“瘦身“?
英伟达研究团队通过结构化权重剪枝和知识蒸馏技术,成功将Llama3.18B
模型压缩
为4B参数的小型语言模型,并取得了不俗的效果。让我们一起来深入探讨这项技术的原理和
蒜鸭
·
2024-08-30 19:28
人工智能
算法
机器学习
论文浅尝 - AAAI2020 | 迈向建立多语言义元知识库:用于 BabelNet Synsets 义元预测...
论文笔记
整理:潘锐,天津大学硕士。来源:AAAI2020链接:https://arxiv.org/pdf/1912.01795.pdf摘要义原被定义为人类语言的最小语义单位。
开放知识图谱
·
2024-08-30 07:35
机器学习
人工智能
知识图谱
自然语言处理
深度学习
大模型训练和推理
.注意力机制与transformer架构二、大模型训练1.SFT训练2.RLHF训练3.分布式并行训练技术(1)模型并行(2)数据并行4.MoE技术4.PEFT训练5.上下文扩展技术三、大模型推理1.
模型压缩
李明朔
·
2024-08-30 01:27
AIGC
深度学习
人工智能
[
论文笔记
] LLM数据集——LongData-Corpus
https://huggingface.co/datasets/yuyijiong/LongData-Corpus1、hf的数据在开发机上要设置sshkey,然后cat复制之后在设置在hf上2、中文小说数据在云盘上清华大学云盘下载:#!/bin/bash#BaseURLbase_url="https://cloud.tsinghua.edu.cn/d/0670fcb14d294c97b5cf/fi
心心喵
·
2024-08-29 10:17
论文笔记
服务器
ubuntu
linux
[
论文笔记
] eval-big-refactor lm_eval 每两个任务使用一个gpu,并保证端口未被使用
1.5B在eval时候两个任务一个gpu是可以的。7B+在evalbelebele时会OOM,所以分配时脚本不同。eval_fast.py:importsubprocessimportargparseimportosimportsocket#参数列表task_name_list=["flores_mt_en_to_id","flores_mt_en_to_vi","flores_mt_en_to_
心心喵
·
2024-08-28 19:00
论文笔记
restful
后端
基于深度学习的高效
模型压缩
基于深度学习的高效
模型压缩
技术在确保模型性能的同时,显著减少了模型的存储需求和计算复杂度,从而使得深度学习模型能够更好地适应资源受限的环境(如移动设备、嵌入式系统)并加快推理速度。
SEU-WYL
·
2024-08-27 19:58
深度学习dnn
深度学习
人工智能
【
论文笔记
】Separating the “Chirp” from the “Chat”: Self-supervised Visual Grounding of Sound and Language
Abstract提出了DenseAV,一种新颖的双编码器接地架构,仅通过观看视频学习高分辨率、语义有意义和视听对齐的特征。在没有明确的本地化监督的情况下,DenseAV可以发现单词的"意义"和声音的"位置"。此外,它在没有监督的情况下自动发现并区分这两种类型的关联。DenseAV的定位能力源于一种新的多头特征聚合算子,该算子直接比较稠密的图像和音频表示进行对比学习。相比之下,许多其他学习"全局"音
xhyu61
·
2024-08-26 14:46
机器学习
学习笔记
论文笔记
论文阅读
【机器学习】机器学习与大模型在人工智能领域的融合应用与性能优化新探索
文章目录引言机器学习与大模型的基本概念机器学习概述监督学习无监督学习强化学习大模型概述GPT-3BERTResNetTransformer机器学习与大模型的融合应用自然语言处理文本生成文本分类机器翻译图像识别自动驾驶医学影像分析语音识别智能助手语音转文字大模型性能优化的新探索
模型压缩
权重剪枝量化知识蒸馏分布式训练数据并行模型并行异步训练高效推理模型裁剪缓存机制专用硬件未来展望跨领域应用智能化系统人
E绵绵
·
2024-08-26 06:25
Everything
人工智能
机器学习
大模型
python
AIGC
应用
科技
图形学
论文笔记
文章目录PBD:XPBD:shapematchingPBD:【深入浅出NvidiaFleX】(1)PositionBasedDynamics最简化的PBD(基于位置的动力学)算法详解-论文原理讲解和太极代码最简化的PBD(基于位置的动力学)算法详解-论文原理讲解和太极代码XPBD:基于XPBD的物理模拟一条龙:公式推导+代码+文字讲解(纯自制)【论文精读】XPBD基于位置的动力学XPBD论文解读(
Jozky86
·
2024-08-25 18:10
图形学
图形学
笔记
【视觉三维重建】【
论文笔记
】Deblurring 3D Gaussian Splatting
去模糊的3D高斯泼溅,看Demo比3D高斯更加精细,对场景物体细节的还原度更高,[官网](https://benhenryl.github.io/Deblurring-3D-Gaussian-Splatting/)背景技术Volumetricrendering-basednerualfields:NeRF.Rasterizationrendering:3D-GS.Rasterization比vol
CS_Zero
·
2024-03-12 05:51
论文阅读
[
论文笔记
] Transformer-XL
这篇论文提出的Transformer-XL主要是针对Transformer在解决长依赖问题中受到固定长度上下文的限制,如Bert采用的Transformer最大上下文为512(其中是因为计算资源的限制,不是因为位置编码,因为使用的是绝对位置编码正余弦编码)。Transformer-XL能学习超过固定长度的依赖性,而不破坏时间一致性。它由段级递归机制和一种新的位置编码方案组成。该方法不仅能够捕获长期
心心喵
·
2024-03-08 14:09
论文笔记
transformer
深度学习
人工智能
SimpleShot: Revisiting Nearest-Neighbor Classification for Few-Shot Learning
论文笔记
前言目前大多数小样本学习器首先使用一个卷积网络提取图像特征,然后将元学习方法与最近邻分类器结合起来,以进行图像识别。本文探讨了这样一种可能性,即在不使用元学习方法,而仅使用最近邻分类器的情况下,能否很好地处理小样本学习问题。本文发现,对图像特征进行简单的特征转换,然后再进行最近邻分类,也可以产生很好的小样本学习结果。比如,使用DenseNet特征的最近邻分类器,在结合均值相减(meansubtra
头柱碳只狼
·
2024-02-24 10:28
小样本学习
多模态相关
论文笔记
(cilp)LearningTransferableVisualModelsFromNaturalLanguageSupervision从自然语言监督中学习可迁移的视觉模型openAI2021年2月48页PDFCODECLIP(ContrastiveLanguage-ImagePre-Training)对比语言图像预训练模型引言它比ImageNet模型效果更好,计算效率更高。尤其是zero-sho
靖待
·
2024-02-24 10:27
大模型
人工智能
论文阅读
大模型量化技术原理-LLM.int8()、GPTQ
近年来,随着Transformer、MOE架构的提出,使得深度学习模型轻松突破上万亿规模参数,从而导致模型变得越来越大,因此,我们需要一些大
模型压缩
技术来降低模型部署的成本,并提升模型的推理性能。
吃果冻不吐果冻皮
·
2024-02-20 21:39
动手学大模型
人工智能
【
论文笔记
· PFM】Lag-Llama: Towards Foundation Models for Time Series Forecasting
Lag-Llama:TowardsFoundationModelsforTimeSeriesForecasting摘要本文提出Lag-Llama,在大量时间序列数据上训练的通用单变量概率时间序列预测模型。模型在分布外泛化能力上取得较好效果。模型使用平滑破坏幂律(smoothlybrokenpower-laws)。介绍目前任务主要集中于在相同域的数据上训练模型。当前已有的大规模通用模型在大规模不同数
lokol.
·
2024-02-20 08:49
论文笔记
论文阅读
llama
【
论文笔记
】Unsupervised Learning of Video Representations using LSTMs
摘要翻译我们使用长短时记忆(LongShortTermMemory,LSTM)网络来学习视频序列的表征。我们的模型使用LSTM编码器将输入序列映射到一个固定长度的表征向量。之后我们用一个或多个LSTM解码器解码这个表征向量来实现不同的任务,比如重建输入序列、预测未来序列。我们对两种输入序列——原始的图像小块和预训练卷积网络提取的高层表征向量——都做了实验。我们探索不同的设计选择,例如解码器的LST
奶茶不加糖え
·
2024-02-20 08:25
lstm
深度学习
自然语言处理
MOSSE算法
论文笔记
以及代码解释
论文《VisualObjectTrackingusingAdaptiveCorrelationFilters》代码github1.论文idea提出以滤波器求相关的形式,找到最大响应处的位置,也就是我们所跟踪的目标的中心,进而不断的更新跟踪目标框和滤波器。2.跟踪策略如图,根据初始帧圈出的目标框训练滤波器,最大响应处为目标框的中心点,当移动到下一帧时,根据滤波器求相关的算法获得最大响应值,进而得出下
five days
·
2024-02-20 06:51
计算机视觉
深度学习
机器学习
Attention Is All Your Need
论文笔记
论文解决了什么问题?提出了一个新的简单网络架构——transformer,仅仅是基于注意力机制,完全免去递推和卷积,使得神经网络训练地速度极大地提高。Weproposeanewsimplenetworkarchitecture,theTransformer,basedsolelyonattentionmechanisms,dispensingwithrecurrenceandconvolution
xiaoyan_lu
·
2024-02-19 13:09
论文笔记
论文阅读
论文笔记
:相似感知的多模态假新闻检测
整理了RecSys2020ProgressiveLayeredExtraction:ANovelMulti-TaskLearningModelforPersonalizedRecommendations)论文的阅读笔记背景模型实验论文地址:SAFE背景 在此之前,对利用新闻文章中文本信息和视觉信息之间的关系(相似性)的关注较少。这种相似性有助于识别虚假新闻,例如,虚假新闻也许会试图使用不相关的图
图学习的小张
·
2024-02-11 19:11
论文笔记
论文阅读
python
[论文总结] 深度学习在农业领域应用
论文笔记
12
文章目录1.3D-ZeF:A3DZebrafishTrackingBenchmarkDataset(CVPR,2020)摘要背景相关研究所提出的数据集方法和结果个人总结2.Automatedflowerclassificationoveralargenumberofclasses(ComputerVision,Graphics&ImageProcessing,2008)摘要背景分割与分类数据集和实
落痕的寒假
·
2024-02-11 12:26
论文总结
深度学习
论文阅读
人工智能
论文笔记
之LINE:Large-scale Information Network Embedding
原文:LINE:Large-scaleInformationNetworkEmbedding本文提出一种新的networkembeddingmodel:LINE.能够处理大规模的各式各样的网络,比如:有向图、无向图、有权重图、无权重图.文中指出对于networkembedding问题,需要保留localstructure和globalstructure,分别对应first-orderproximi
小弦弦喵喵喵
·
2024-02-11 03:13
打败一切NeRF! 3D Gaussian Splatting 的 简单入门知识
新手的
论文笔记
3DGaussianSplatting的笔记introductionRelatedwork预备知识Gaussiansplatting3D高斯泼溅原理Overview3DGaussianSplatting
Ci_ci 17
·
2024-02-10 10:48
3d
python
《Residual Bi-Fusion Feature Pyramid Network for Accurate Single-shot Object Detection》
论文笔记
参考代码:无1.概述导读:在检测任务中一般会引入FPN增强在不同尺度下网络的检测性能,但是只通过top-down的FPN网络是很难去重建由于特征图的漂移(水平或是垂直方向运动)在经过pooling操作(pooling不具有平移不变性)带来结果相差很大的问题(特别针对小目标),而且FPN带来的性能提升会在使用较多卷积层之后逐渐被稀释(卷积的平移不变形),进而会导致一些小目标定位性能降低。对此可以通过
m_buddy
·
2024-02-09 18:37
#
General
Object
Detection
Bi-Fusion
论文笔记
-Generative Adversarial Nets
论文链接:https://papers.nips.cc/paper/2014/file/5ca3e9b122f61f8f06494c97b1afccf3-Paper.pdf论文解读:https://www.bilibili.com/video/BV1rb4y187vD?share_source=copy_web一句话总结:提出了生成模型框架GAN,包括一个生成模型G和一个判别模型D,用有监督的损失
升不上三段的大鱼
·
2024-02-09 05:49
论文笔记
:NIPS 2020 Graph Contrastive Learning with Augmentations
前言本文主要提出在图对比学习大框架下的图数据增强的若干方法。概括来说,本文提出了一种图对比学习框架来无监督的完成图表示学习,首先作者提出了基于各种先验信息的四种图数据增强方法。然后,作者分析了在四种不同的图数据增强条件下,不同组合对多个数据集的影响:半监督、无监督、迁移学习以及对抗性攻击。作者为GNN的预训练提出了基于图数据增强的对比学习框架来解决图中数据异质性的挑战,本文的主要贡献如下:作者提出
饮冰l
·
2024-02-09 00:54
图
弱监督
数据挖掘
机器学习
神经网络
深度学习
模型压缩
开源项目:阿里-tinyNAS/微软NNI/华为-vega
文章目录阿里-TinyNAS使用流程步骤一:搜索模型结构步骤二:导出模型结果步骤三:使用搜索的模型结构图像分类任务目标检测任务华为-vega简介定位优点缺点微软NNI简介定位优点缺点阿里-TinyNAShttps://github.com/alibaba/lightweight-neural-architecture-search聚焦NAS,进行合理的模块划分;更偏向算法使用平台,搜索得到精度较好
清风2022
·
2024-02-07 10:35
tinyNAS
神经网络
AutoML
vega
论文笔记
-vChain: Enabling Verifiable Boolean Range Queries over Blockchain Databases
核心方法:提出了一种基于累加器的可认证数据结构,可以动态聚合任意查询属性提出块内和块间索引,聚合块内和块间数据,可以做高效查询验证倒排前缀树结构,加速同时处理大量数据的订阅查询提出问题:1.range查询2.布尔查询3.没有可靠第三方、而且不能保证查询的完整性图中元素有:①全节点②矿工节点:是全节点,而且负责构建共识证明,比如计算nonce③轻节点:存nonce、区块的哈希,不存数据记录提出的Vc
qq_40431700
·
2024-02-06 16:38
笔记
区块链
自然语言处理 | (13)kenLM统计语言模型构建与应用
目录1.实验准备2.训练数据3.训练语言模型4.
模型压缩
5.模型加载6.智能纠错1.实验准备安装依赖#安装依赖!aptinstalllibboost-all-dev!
CoreJT
·
2024-02-06 07:21
自然语言处理
自然语言处理(NLP)
kenLM工具库
统计语言模型
n-gram
智能纠错
今日arXiv最热NLP大模型论文:微软提出SliceGPT,删除25%模型参数,性能几乎无损
为了缓解这些资源限制,研究者们提出了多种
模型压缩
方法,其中剪枝(pruning)技术因其在后训练阶段应用的潜力而备受关注。
夕小瑶
·
2024-02-06 01:56
自然语言处理
人工智能
论文笔记
--Improving Language Understanding by Generative Pre-Training
论文笔记
GPT1--ImprovingLanguageUnderstandingbyGenerativePre-Training1.文章简介2.文章导读2.1概括2.2文章重点技术2.2.1无监督预训练
Isawany
·
2024-02-05 15:20
论文阅读
论文阅读
自然语言处理
chatgpt
语言模型
nlp
最新
论文笔记
(+21):Privacy-Preserving Byzantine-Robust Federated Learning via Blockchain Systems/ TIFS2022
Privacy-PreservingByzantine-RobustFederatedLearningviaBlockchainSystems可译为“利用区块链实现隐私保护的拜占庭鲁棒性联邦学习”这篇是今年八月份被TIFS2022(CCFA)收录的文章,写的利用全同态加密和区块链技术解决联邦学习中隐私问题和可信问题(虽然区块链仅仅只是存储的作用,也稍微提了一下)。精读完这篇文章,整体感觉还不错,毕
cryptocxf
·
2024-02-05 10:24
论文笔记
联邦学习
论文阅读
区块链
Encoder-based Domain Tuning for Fast Personalization of Text-to-Image Models——【
论文笔记
】
本文是发表于ACMTransactionsonGraphics期刊上的一篇论文论文地址:[2302.12228]基于编码器的域优化,用于文本到图像模型的快速个性化(arxiv.org)官方代码:mkshing/e4t-diffusion:实现基于编码器的域调优,以实现文本到图像模型的快速个性化(github.com)一、Introduction近年来,个性化大规模文本到图像模型的能力已经彻底改变了
我是浮夸
·
2024-02-04 14:51
论文笔记
论文阅读
深度学习
人工智能
stable
diffusion
图像处理
SVDiff: Compact Parameter Space for Diffusion Fine-Tuning——【
论文笔记
】
本文发表于ICCV2023论文地址:ICCV2023OpenAccessRepository(thecvf.com)官方代码:mkshing/svdiff-pytorch:Implementationof"SVDiff:CompactParameterSpaceforDiffusionFine-Tuning"(github.com)一、Introduction最近几年,基于扩散的文本到图像生成模型
我是浮夸
·
2024-02-04 14:19
论文笔记
论文阅读
深度学习
图像处理
stable
diffusion
论文浅尝 | 动态知识图谱对齐
论文笔记
整理:谭亦鸣,东南大学博士生来源:AAAI‘21链接:https://ojs.aaai.org/index.php/AAAI/article/view/16585概述本文提出了一种动态图谱(KG
开放知识图谱
·
2024-02-04 07:05
算法
python
机器学习
人工智能
java
《Revisiting Self-Supervised Monocular Depth Estimation》
论文笔记
参考代码:rmd1.概述介绍:回顾前几年的一些自监督型深度估计算法,它们都是从不同的角度对自监督深度估计方法进行改进。总结这些算法中对自监督深度估计的改进idea,发现这些算法有的是为了解决场景光照变化对深度估计稳定性的影响;有的是对相机运动下场景中物体遮挡运动进行建模,从而减少对于前期假设先验的违背的影响。而这些改进的idea它们的来源是不同的文章,那么它们组合起来是否能达到比原方法更好的效果呢
m_buddy
·
2024-02-02 20:59
#
Depth
Estimation
self-supervised
depth
《LeReS:Learning to Recover 3D Scene Shape from a Single Image》
论文笔记
参考代码:AdelaiDepth-LeReS1.概述介绍:基于单张图像的深度估计网络往往采用scale-shiftinvariant形式完成深度预测,其是将预测深度和GT深度映射到scale-shiftinvariant空间,之后再计算loss,自然使用该方法得到的深度在经过点云映射之后是存在扭曲的,这类方法以MiDaS为代表。除scale-shift之外其还存在焦距(focal)上的不确定,因而
m_buddy
·
2024-02-02 20:29
#
Depth
Estimation
3d
计算机视觉
深度学习
LeReS
《Enforcing geometric constraints of virtual normal for depth prediction》
论文笔记
参考代码:VNL_Monocular_Depth_Prediction1.概述介绍:这篇文章为深度估计提供了一种新的损失函数形式,在深度估计任务中常见的损失函数多以pixel-wise监督的形式出现,因此这些监督损失函数都是利用像素层面的浅层信息进行监督约束的。这样的浅层次深度信息学习自然不能很好学习到GT深度中的一些细节与结构差异信息,因而这篇文章提出将预测深度通过预先假定的相机内参映射到同一模
m_buddy
·
2024-02-02 20:29
#
Depth
Estimation
深度学习
计算机视觉
人工智能
《Boosting Monocular Depth Estimation Models to High-Resolution ...》
论文笔记
参考代码:BoostingMonocularDepth论文:BoostingMonocularDepthEstimationModelstoHigh-ResolutionviaContent-AdaptiveMulti-ResolutionMerging1.概述导读:这篇文章提出了一种使用现有深度估计模型(MiDas)生成具有更高分辨率/更多细节表现深度图的方法(同时保持高分辨率和深度一致性是现存
m_buddy
·
2024-02-02 20:28
#
Depth
Estimation
深度估计
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他