E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
行人重识别论文笔记
论文笔记
—NDT-Transformer: Large-Scale 3D Point Cloud Localization using the Normal Distribution Transfor
论文笔记
—NDT-Transformer:Large-Scale3DPointCloudLocalizationusingtheNormalDistributionTransformRepresentation
入门打工人
·
2024-09-10 03:09
笔记
slam
定位
算法
[
论文笔记
]Circle Loss: A Unified Perspective of Pair Similarity Optimization
引言为了理解CoSENT的loss,今天来读一下CircleLoss:AUnifiedPerspectiveofPairSimilarityOptimization。为了简单,下文中以翻译的口吻记录,比如替换"作者"为"我们"。这篇论文从对深度特征学习的成对相似度优化角度出发,旨在最大化同类之间的相似度sps_ps
愤怒的可乐
·
2024-09-05 07:18
#
文本匹配[论文]
论文翻译/笔记
自然语言处理
论文阅读
人工智能
【
论文笔记
】Multi-Task Learning as a Bargaining Game
Abstract本文将多任务学习中的梯度组合步骤视为一种讨价还价式博弈(bargaininggame),通过游戏,各个任务协商出共识梯度更新方向。在一定条件下,这种问题具有唯一解(NashBargainingSolution),可以作为多任务学习中的一种原则方法。本文提出Nash-MTL,推导了其收敛性的理论保证。1Introduction大部分MTL优化算法遵循一个通用方案。计算所有任务的梯度g
xhyu61
·
2024-09-03 09:26
机器学习
学习笔记
论文笔记
论文阅读
人工智能
深度学习
[
论文笔记
] LLaVA
一、LLaVA论文中的主要工作和实验结果ExistingGap:之前的大部分工作都在做模态对齐,做图片的representationlearning,而没有针对ChatBot(多轮对话,指令理解)这种场景优化。Contribution:这篇工作已经在BLIP-2之后了,所以Image的理解能力不是LLaVA希望提升的重点,LLaVA是想提升多模态模型的Instruction-Followingab
心心喵
·
2024-09-03 08:53
论文笔记
论文阅读
[
论文笔记
] LLM模型剪枝
AttentionIsAllYouNeedButYouDon’tNeedAllOfItForInferenceofLargeLanguageModelsLLaMA2在剪枝时,跳过ffn和跳过fulllayer的效果差不多。相比跳过ffn/fulllayer,跳过attentionlayer的影响会更小。跳过attentionlayer:7B/13B从100%参数剪枝到66%,平均指标只下降1.7~
心心喵
·
2024-09-03 08:53
论文笔记
论文阅读
剪枝
算法
【
论文笔记
】Training language models to follow instructions with human feedback B部分
TraininglanguagemodelstofollowinstructionswithhumanfeedbackB部分回顾一下第一代GPT-1:设计思路是“海量无标记文本进行无监督预训练+少量有标签文本有监督微调”范式;模型架构是基于Transformer的叠加解码器(掩码自注意力机制、残差、Layernorm);下游各种具体任务的适应是通过在模型架构的输出后增加线性权重WyW_{y}Wy实
Ctrl+Alt+L
·
2024-09-02 01:12
大模型论文整理
论文笔记
论文阅读
语言模型
人工智能
自然语言处理
【
论文笔记
】:LAYN:用于小目标检测的轻量级多尺度注意力YOLOv8网络
背景针对嵌入式设备对目标检测算法的需求,大多数主流目标检测框架目前缺乏针对小目标的具体改进,然后提出的一种轻量级多尺度注意力YOLOv8小目标检测算法。小目标检测精度低的原因随着网络在训练过程中的加深,检测到的目标容易丢失边缘信息和灰度信息等。获得高级语义信息也较少,图像中可能存在一些噪声信息,误导训练网络学习不正确的特征。映射到原始图像的感受野的大小。当感受野相对较小时,空间结构特征保留较多,但
hhhhhhkkkyyy
·
2024-09-01 10:39
论文阅读
目标检测
YOLO
激光SLAM--(8) LeGO-LOAM
论文笔记
论文标题:LeGO-LOAM:LightweightandGround-OptimizedLidarOdometryandMappingonVariableTerrain应用在可变地形场景的轻量级的、并利用地面优化的LOAMABSTRACT轻量级的、基于地面优化的LOAM实时进行六自由度位姿估计,应用在地面的车辆上。强调应用在地面车辆上是因为在这里面要求雷达必须水平安装,而像LOAM和LIO-SA
lonely-stone
·
2024-08-30 20:29
slam
激光SLAM
论文阅读
论文浅尝 - AAAI2020 | 迈向建立多语言义元知识库:用于 BabelNet Synsets 义元预测...
论文笔记
整理:潘锐,天津大学硕士。来源:AAAI2020链接:https://arxiv.org/pdf/1912.01795.pdf摘要义原被定义为人类语言的最小语义单位。
开放知识图谱
·
2024-08-30 07:35
机器学习
人工智能
知识图谱
自然语言处理
深度学习
[
论文笔记
] LLM数据集——LongData-Corpus
https://huggingface.co/datasets/yuyijiong/LongData-Corpus1、hf的数据在开发机上要设置sshkey,然后cat复制之后在设置在hf上2、中文小说数据在云盘上清华大学云盘下载:#!/bin/bash#BaseURLbase_url="https://cloud.tsinghua.edu.cn/d/0670fcb14d294c97b5cf/fi
心心喵
·
2024-08-29 10:17
论文笔记
服务器
ubuntu
linux
[
论文笔记
] eval-big-refactor lm_eval 每两个任务使用一个gpu,并保证端口未被使用
1.5B在eval时候两个任务一个gpu是可以的。7B+在evalbelebele时会OOM,所以分配时脚本不同。eval_fast.py:importsubprocessimportargparseimportosimportsocket#参数列表task_name_list=["flores_mt_en_to_id","flores_mt_en_to_vi","flores_mt_en_to_
心心喵
·
2024-08-28 19:00
论文笔记
restful
后端
【
论文笔记
】Separating the “Chirp” from the “Chat”: Self-supervised Visual Grounding of Sound and Language
Abstract提出了DenseAV,一种新颖的双编码器接地架构,仅通过观看视频学习高分辨率、语义有意义和视听对齐的特征。在没有明确的本地化监督的情况下,DenseAV可以发现单词的"意义"和声音的"位置"。此外,它在没有监督的情况下自动发现并区分这两种类型的关联。DenseAV的定位能力源于一种新的多头特征聚合算子,该算子直接比较稠密的图像和音频表示进行对比学习。相比之下,许多其他学习"全局"音
xhyu61
·
2024-08-26 14:46
机器学习
学习笔记
论文笔记
论文阅读
图形学
论文笔记
文章目录PBD:XPBD:shapematchingPBD:【深入浅出NvidiaFleX】(1)PositionBasedDynamics最简化的PBD(基于位置的动力学)算法详解-论文原理讲解和太极代码最简化的PBD(基于位置的动力学)算法详解-论文原理讲解和太极代码XPBD:基于XPBD的物理模拟一条龙:公式推导+代码+文字讲解(纯自制)【论文精读】XPBD基于位置的动力学XPBD论文解读(
Jozky86
·
2024-08-25 18:10
图形学
图形学
笔记
计算机设计大赛
行人重识别
(person reid) - 机器视觉 深度学习 opencv python
文章目录0前言1技术背景2技术介绍3重识别技术实现3.1数据集3.2PersonREID3.2.1算法原理3.2.2算法流程图4实现效果5部分代码6最后0前言优质竞赛项目系列,今天要分享的是深度学习
行人重识别
iuerfee
·
2024-03-12 15:33
python
【视觉三维重建】【
论文笔记
】Deblurring 3D Gaussian Splatting
去模糊的3D高斯泼溅,看Demo比3D高斯更加精细,对场景物体细节的还原度更高,[官网](https://benhenryl.github.io/Deblurring-3D-Gaussian-Splatting/)背景技术Volumetricrendering-basednerualfields:NeRF.Rasterizationrendering:3D-GS.Rasterization比vol
CS_Zero
·
2024-03-12 05:51
论文阅读
[
论文笔记
] Transformer-XL
这篇论文提出的Transformer-XL主要是针对Transformer在解决长依赖问题中受到固定长度上下文的限制,如Bert采用的Transformer最大上下文为512(其中是因为计算资源的限制,不是因为位置编码,因为使用的是绝对位置编码正余弦编码)。Transformer-XL能学习超过固定长度的依赖性,而不破坏时间一致性。它由段级递归机制和一种新的位置编码方案组成。该方法不仅能够捕获长期
心心喵
·
2024-03-08 14:09
论文笔记
transformer
深度学习
人工智能
SimpleShot: Revisiting Nearest-Neighbor Classification for Few-Shot Learning
论文笔记
前言目前大多数小样本学习器首先使用一个卷积网络提取图像特征,然后将元学习方法与最近邻分类器结合起来,以进行图像识别。本文探讨了这样一种可能性,即在不使用元学习方法,而仅使用最近邻分类器的情况下,能否很好地处理小样本学习问题。本文发现,对图像特征进行简单的特征转换,然后再进行最近邻分类,也可以产生很好的小样本学习结果。比如,使用DenseNet特征的最近邻分类器,在结合均值相减(meansubtra
头柱碳只狼
·
2024-02-24 10:28
小样本学习
多模态相关
论文笔记
(cilp)LearningTransferableVisualModelsFromNaturalLanguageSupervision从自然语言监督中学习可迁移的视觉模型openAI2021年2月48页PDFCODECLIP(ContrastiveLanguage-ImagePre-Training)对比语言图像预训练模型引言它比ImageNet模型效果更好,计算效率更高。尤其是zero-sho
靖待
·
2024-02-24 10:27
大模型
人工智能
论文阅读
【
论文笔记
· PFM】Lag-Llama: Towards Foundation Models for Time Series Forecasting
Lag-Llama:TowardsFoundationModelsforTimeSeriesForecasting摘要本文提出Lag-Llama,在大量时间序列数据上训练的通用单变量概率时间序列预测模型。模型在分布外泛化能力上取得较好效果。模型使用平滑破坏幂律(smoothlybrokenpower-laws)。介绍目前任务主要集中于在相同域的数据上训练模型。当前已有的大规模通用模型在大规模不同数
lokol.
·
2024-02-20 08:49
论文笔记
论文阅读
llama
【
论文笔记
】Unsupervised Learning of Video Representations using LSTMs
摘要翻译我们使用长短时记忆(LongShortTermMemory,LSTM)网络来学习视频序列的表征。我们的模型使用LSTM编码器将输入序列映射到一个固定长度的表征向量。之后我们用一个或多个LSTM解码器解码这个表征向量来实现不同的任务,比如重建输入序列、预测未来序列。我们对两种输入序列——原始的图像小块和预训练卷积网络提取的高层表征向量——都做了实验。我们探索不同的设计选择,例如解码器的LST
奶茶不加糖え
·
2024-02-20 08:25
lstm
深度学习
自然语言处理
行人重识别
行人重识别
(personre-identification)是近几年智能视频分析领域兴起的一项新技术,属于在复杂视频环境下的图像处理和分析范畴,是许多监控和安防应用中的主要任务,并且在计算机视觉领域获得了越来越多的关注
NineDays66
·
2024-02-20 07:40
人工智能
MOSSE算法
论文笔记
以及代码解释
论文《VisualObjectTrackingusingAdaptiveCorrelationFilters》代码github1.论文idea提出以滤波器求相关的形式,找到最大响应处的位置,也就是我们所跟踪的目标的中心,进而不断的更新跟踪目标框和滤波器。2.跟踪策略如图,根据初始帧圈出的目标框训练滤波器,最大响应处为目标框的中心点,当移动到下一帧时,根据滤波器求相关的算法获得最大响应值,进而得出下
five days
·
2024-02-20 06:51
计算机视觉
深度学习
机器学习
Attention Is All Your Need
论文笔记
论文解决了什么问题?提出了一个新的简单网络架构——transformer,仅仅是基于注意力机制,完全免去递推和卷积,使得神经网络训练地速度极大地提高。Weproposeanewsimplenetworkarchitecture,theTransformer,basedsolelyonattentionmechanisms,dispensingwithrecurrenceandconvolution
xiaoyan_lu
·
2024-02-19 13:09
论文笔记
论文阅读
论文笔记
:相似感知的多模态假新闻检测
整理了RecSys2020ProgressiveLayeredExtraction:ANovelMulti-TaskLearningModelforPersonalizedRecommendations)论文的阅读笔记背景模型实验论文地址:SAFE背景 在此之前,对利用新闻文章中文本信息和视觉信息之间的关系(相似性)的关注较少。这种相似性有助于识别虚假新闻,例如,虚假新闻也许会试图使用不相关的图
图学习的小张
·
2024-02-11 19:11
论文笔记
论文阅读
python
[论文总结] 深度学习在农业领域应用
论文笔记
12
文章目录1.3D-ZeF:A3DZebrafishTrackingBenchmarkDataset(CVPR,2020)摘要背景相关研究所提出的数据集方法和结果个人总结2.Automatedflowerclassificationoveralargenumberofclasses(ComputerVision,Graphics&ImageProcessing,2008)摘要背景分割与分类数据集和实
落痕的寒假
·
2024-02-11 12:26
论文总结
深度学习
论文阅读
人工智能
论文笔记
之LINE:Large-scale Information Network Embedding
原文:LINE:Large-scaleInformationNetworkEmbedding本文提出一种新的networkembeddingmodel:LINE.能够处理大规模的各式各样的网络,比如:有向图、无向图、有权重图、无权重图.文中指出对于networkembedding问题,需要保留localstructure和globalstructure,分别对应first-orderproximi
小弦弦喵喵喵
·
2024-02-11 03:13
打败一切NeRF! 3D Gaussian Splatting 的 简单入门知识
新手的
论文笔记
3DGaussianSplatting的笔记introductionRelatedwork预备知识Gaussiansplatting3D高斯泼溅原理Overview3DGaussianSplatting
Ci_ci 17
·
2024-02-10 10:48
3d
python
跨模态
行人重识别
:Cross-Modality Person Re-Identification with Generative Adversarial Training 学习记录笔记
目录摘要方法cmGANGeneratorDiscriminatorTrainingAlgorithmExperiments论文链接:https://www.ijcai.org/Proceedings/2018/0094.pdf摘要(1)提出一种新的跨模态生成对抗网络(称为cmGAN)。为了解决鉴别信息不足的问题,设计了一种基于生成对抗训练的鉴别器,从不同的模式中学习鉴别特征表示。(2)为了解决大规
深度学不会习
·
2024-02-09 22:35
深度学习
跨模态
行人重识别
:Discover Cross-Modality Nuances for Visible-Infrared Person Re-Identification学习记录笔记
目录摘要网络结构具体方法MAMPAM模态分类损失共享特征ID损失中心簇损失总损失试验注意模式可视化分布结果原文链接:DiscoverCross-ModalityNuancesforVisible-InfraredPersonRe-Identification摘要提出了一种联合模态和模式对齐网络(MPANet)来发现可见红外人Re-ID不同模式中的跨模态细微差别,它引入了模态缓解模块和模式对齐模块来共
深度学不会习
·
2024-02-09 22:35
学习
跨模态
行人重识别
:Dynamic Dual-Attentive Aggregation Learningfor Visible-Infrared Person Re-Identification学习笔记
目录摘要方法模态内加权聚合(IWPA)跨模态图结构化注意力(CGSA)GraphConstructionGraphAttention动态对偶聚合学习试验论文链接:DynamicDual-AttentiveAggregationLearningforVisible-InfraredPersonRe-Identification摘要通过挖掘VI-ReID的模态内部分级和跨模态图级上下文线索,提出了一种新
深度学不会习
·
2024-02-09 22:35
学习
跨模态
行人重识别
:Modality Synergy Complement Learning withCascaded Aggregation for Visible-InfraredPerson 笔记
目录简述贡献MSCLNet方法模态协同模块模态补充模块级联聚合策略子类级聚合类内聚合类间级上的聚合目标函数基于级联聚合的模态协同互补学习在可见光-红外人员识别中的应用简述级联聚合的模态协同互补学习网络(MSCLNET)。基本思想是协同两个模态来构造不同的身份鉴别语义和较少噪声的表示。然后,在这两种模式的优点下对协同表征进行了补充。此外,提出了级联聚合策略,用于细粒度的特征分布优化,该策略将子类、类
深度学不会习
·
2024-02-09 22:35
深度学习
python
行人重识别
(二)跨模态的
行人重识别
感谢前辈总结的论文列表,为了方便自己以后翻阅,链接搁这儿1.背景在我们现实生活中,可见光条件下的摄像机拍到的图像,往往会包含行人的大部分外观信息,然而现实中并不只需要在可视条件极佳的条件下进行监控,在夜晚或者可视条件极差的场景中也有监控的需要,这个时候,红外相机拍摄的图像便可用于行人的再识别。据我所知,现阶段大部分ReID工作都聚焦在RGB图像这种单一模态上,而基于RGB-IR的跨模态ReID工作
石头儿啊
·
2024-02-09 22:35
行人重识别
计算机视觉
人工智能
使用中间X模态的跨模态
行人重识别
引入X模态作为辅助,将红外线--可见光跨模态学习转化为X-IR-V三模态学习,提出了一个X-红外-可见光(XIV)ReID跨模态学习框架。首先X模态由轻量型网络生成,其次,在xiv框架下,跨模态学习由一个精心设计的模态间隙约束引导,信息交换跨越可见、x和红外模态。基于红外图像的图像主要包括结构和形状信息X模态是一种伴随辅助模态,用于协调红外和可见光。一个轻量级X模态生成器和一个权重共享XIV跨模态
小小猿D
·
2024-02-09 22:05
笔记
【跨模态
行人重识别
】RGB-Infrared Cross-Modality Person Re-Identification(ICCV2017)
文章目录摘要1介绍2SYSU-MM01数据集2.1数据集描述2.2评估标准3跨模态模型的网络结构比较3.1常见的深度模型网络结构3.2网络结构分析单流结构和双流结构在特殊情况下的联系(双流网络可以用单流网络表示)一般情况下的单流结构分析4深度零填充4.1零填充作为网络输入的分析(梯度分析)4.2RGB-IR应用深度零填充4.3跨模态学习的比较5实验5.1比较的模型5.2模型比较与分析6总结摘要行人
渺渺404
·
2024-02-09 22:05
跨模态行人重识别
计算机视觉
人工智能
深度学习
跨模态
行人重识别
综述 - 计算机视觉
跨模态
行人重识别
综述-计算机视觉0引言近年来,随着智能监控领域的不断发展,单纯凭借传统的人力已经很难在对复杂的监控场景做出完善详尽的处理。
小小猿D
·
2024-02-09 22:34
笔记
深度学习
跨模态
行人重识别
都需要学什么
跨模态
行人重识别
(Cross-ModalityPersonRe-identification,简称Cross-ModalityRe-ID)是计算机视觉领域的一项挑战性任务,旨在跨越不同模态之间(例如,可见光与红外线图像
ALGORITHM LOL
·
2024-02-09 22:04
人工智能
《Residual Bi-Fusion Feature Pyramid Network for Accurate Single-shot Object Detection》
论文笔记
参考代码:无1.概述导读:在检测任务中一般会引入FPN增强在不同尺度下网络的检测性能,但是只通过top-down的FPN网络是很难去重建由于特征图的漂移(水平或是垂直方向运动)在经过pooling操作(pooling不具有平移不变性)带来结果相差很大的问题(特别针对小目标),而且FPN带来的性能提升会在使用较多卷积层之后逐渐被稀释(卷积的平移不变形),进而会导致一些小目标定位性能降低。对此可以通过
m_buddy
·
2024-02-09 18:37
#
General
Object
Detection
Bi-Fusion
论文笔记
-Generative Adversarial Nets
论文链接:https://papers.nips.cc/paper/2014/file/5ca3e9b122f61f8f06494c97b1afccf3-Paper.pdf论文解读:https://www.bilibili.com/video/BV1rb4y187vD?share_source=copy_web一句话总结:提出了生成模型框架GAN,包括一个生成模型G和一个判别模型D,用有监督的损失
升不上三段的大鱼
·
2024-02-09 05:49
论文笔记
:NIPS 2020 Graph Contrastive Learning with Augmentations
前言本文主要提出在图对比学习大框架下的图数据增强的若干方法。概括来说,本文提出了一种图对比学习框架来无监督的完成图表示学习,首先作者提出了基于各种先验信息的四种图数据增强方法。然后,作者分析了在四种不同的图数据增强条件下,不同组合对多个数据集的影响:半监督、无监督、迁移学习以及对抗性攻击。作者为GNN的预训练提出了基于图数据增强的对比学习框架来解决图中数据异质性的挑战,本文的主要贡献如下:作者提出
饮冰l
·
2024-02-09 00:54
图
弱监督
数据挖掘
机器学习
神经网络
深度学习
基于深度学习的
行人重识别
(person reid) 计算机竞赛
文章目录0前言1技术背景2技术介绍3重识别技术实现3.1数据集3.2PersonREID3.2.1算法原理3.2.2算法流程图4实现效果5部分代码6最后0前言优质竞赛项目系列,今天要分享的是基于深度学习的
行人重识别
该项目较为新颖
Mr.D学长
·
2024-02-07 23:47
python
java
互联网加竞赛 基于深度学习的
行人重识别
(person reid)
文章目录0前言1技术背景2技术介绍3重识别技术实现3.1数据集3.2PersonREID3.2.1算法原理3.2.2算法流程图4实现效果5部分代码6最后0前言优质竞赛项目系列,今天要分享的是基于深度学习的
行人重识别
该项目较为新颖
Mr.D学长
·
2024-02-07 23:14
python
java
姿态估计概述
定义和优势单目摄像机拍摄的二维图像中预测行人的人体关键点坐标,为其他任务做支持如
行人重识别
、动作识别。
Diros1g
·
2024-02-07 11:40
姿态估计
论文笔记
-vChain: Enabling Verifiable Boolean Range Queries over Blockchain Databases
核心方法:提出了一种基于累加器的可认证数据结构,可以动态聚合任意查询属性提出块内和块间索引,聚合块内和块间数据,可以做高效查询验证倒排前缀树结构,加速同时处理大量数据的订阅查询提出问题:1.range查询2.布尔查询3.没有可靠第三方、而且不能保证查询的完整性图中元素有:①全节点②矿工节点:是全节点,而且负责构建共识证明,比如计算nonce③轻节点:存nonce、区块的哈希,不存数据记录提出的Vc
qq_40431700
·
2024-02-06 16:38
笔记
区块链
论文笔记
--Improving Language Understanding by Generative Pre-Training
论文笔记
GPT1--ImprovingLanguageUnderstandingbyGenerativePre-Training1.文章简介2.文章导读2.1概括2.2文章重点技术2.2.1无监督预训练
Isawany
·
2024-02-05 15:20
论文阅读
论文阅读
自然语言处理
chatgpt
语言模型
nlp
最新
论文笔记
(+21):Privacy-Preserving Byzantine-Robust Federated Learning via Blockchain Systems/ TIFS2022
Privacy-PreservingByzantine-RobustFederatedLearningviaBlockchainSystems可译为“利用区块链实现隐私保护的拜占庭鲁棒性联邦学习”这篇是今年八月份被TIFS2022(CCFA)收录的文章,写的利用全同态加密和区块链技术解决联邦学习中隐私问题和可信问题(虽然区块链仅仅只是存储的作用,也稍微提了一下)。精读完这篇文章,整体感觉还不错,毕
cryptocxf
·
2024-02-05 10:24
论文笔记
联邦学习
论文阅读
区块链
Encoder-based Domain Tuning for Fast Personalization of Text-to-Image Models——【
论文笔记
】
本文是发表于ACMTransactionsonGraphics期刊上的一篇论文论文地址:[2302.12228]基于编码器的域优化,用于文本到图像模型的快速个性化(arxiv.org)官方代码:mkshing/e4t-diffusion:实现基于编码器的域调优,以实现文本到图像模型的快速个性化(github.com)一、Introduction近年来,个性化大规模文本到图像模型的能力已经彻底改变了
我是浮夸
·
2024-02-04 14:51
论文笔记
论文阅读
深度学习
人工智能
stable
diffusion
图像处理
SVDiff: Compact Parameter Space for Diffusion Fine-Tuning——【
论文笔记
】
本文发表于ICCV2023论文地址:ICCV2023OpenAccessRepository(thecvf.com)官方代码:mkshing/svdiff-pytorch:Implementationof"SVDiff:CompactParameterSpaceforDiffusionFine-Tuning"(github.com)一、Introduction最近几年,基于扩散的文本到图像生成模型
我是浮夸
·
2024-02-04 14:19
论文笔记
论文阅读
深度学习
图像处理
stable
diffusion
论文浅尝 | 动态知识图谱对齐
论文笔记
整理:谭亦鸣,东南大学博士生来源:AAAI‘21链接:https://ojs.aaai.org/index.php/AAAI/article/view/16585概述本文提出了一种动态图谱(KG
开放知识图谱
·
2024-02-04 07:05
算法
python
机器学习
人工智能
java
《Revisiting Self-Supervised Monocular Depth Estimation》
论文笔记
参考代码:rmd1.概述介绍:回顾前几年的一些自监督型深度估计算法,它们都是从不同的角度对自监督深度估计方法进行改进。总结这些算法中对自监督深度估计的改进idea,发现这些算法有的是为了解决场景光照变化对深度估计稳定性的影响;有的是对相机运动下场景中物体遮挡运动进行建模,从而减少对于前期假设先验的违背的影响。而这些改进的idea它们的来源是不同的文章,那么它们组合起来是否能达到比原方法更好的效果呢
m_buddy
·
2024-02-02 20:59
#
Depth
Estimation
self-supervised
depth
《LeReS:Learning to Recover 3D Scene Shape from a Single Image》
论文笔记
参考代码:AdelaiDepth-LeReS1.概述介绍:基于单张图像的深度估计网络往往采用scale-shiftinvariant形式完成深度预测,其是将预测深度和GT深度映射到scale-shiftinvariant空间,之后再计算loss,自然使用该方法得到的深度在经过点云映射之后是存在扭曲的,这类方法以MiDaS为代表。除scale-shift之外其还存在焦距(focal)上的不确定,因而
m_buddy
·
2024-02-02 20:29
#
Depth
Estimation
3d
计算机视觉
深度学习
LeReS
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他