E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
超分辨论文笔记
Python(PyTorch)和MATLAB及Rust和C++结构相似度指数测量导图
要点量化检查图像压缩质量低分辨率多光谱和高分辨率图像实现
超分辨
率分析图像质量图像索引/多尺度结构相似度指数和光谱角映射器及视觉信息保真度多种指标峰值信噪比和结构相似度指数测量结构相似性图像分类PNG和JPEG
亚图跨际
·
2024-09-15 18:20
Python
交叉知识
算法
量化检查图像压缩质量
低分辨率多光谱
峰值信噪比
端到端优化图像压缩
手术机器人
三维实景实时可微分渲染
重建三维可视化
ESRGAN——老旧照片、视频帧的修复和增强,提高图像的分辨率
一、ESRGAN介绍1.1背景
超分辨
率问题是计算机视觉中的一个重要研究领域,其目标是通过增加像素数量来提高图像的分辨率,恢复出更加细腻的图像。
爱研究的小牛
·
2024-09-12 11:35
AIGC——图像
AIGC—视频
AIGC
人工智能
深度学习
音视频
自动化
论文笔记
—NDT-Transformer: Large-Scale 3D Point Cloud Localization using the Normal Distribution Transfor
论文笔记
—NDT-Transformer:Large-Scale3DPointCloudLocalizationusingtheNormalDistributionTransformRepresentation
入门打工人
·
2024-09-10 03:09
笔记
slam
定位
算法
[
论文笔记
]Circle Loss: A Unified Perspective of Pair Similarity Optimization
引言为了理解CoSENT的loss,今天来读一下CircleLoss:AUnifiedPerspectiveofPairSimilarityOptimization。为了简单,下文中以翻译的口吻记录,比如替换"作者"为"我们"。这篇论文从对深度特征学习的成对相似度优化角度出发,旨在最大化同类之间的相似度sps_ps
愤怒的可乐
·
2024-09-05 07:18
#
文本匹配[论文]
论文翻译/笔记
自然语言处理
论文阅读
人工智能
【
论文笔记
】Multi-Task Learning as a Bargaining Game
Abstract本文将多任务学习中的梯度组合步骤视为一种讨价还价式博弈(bargaininggame),通过游戏,各个任务协商出共识梯度更新方向。在一定条件下,这种问题具有唯一解(NashBargainingSolution),可以作为多任务学习中的一种原则方法。本文提出Nash-MTL,推导了其收敛性的理论保证。1Introduction大部分MTL优化算法遵循一个通用方案。计算所有任务的梯度g
xhyu61
·
2024-09-03 09:26
机器学习
学习笔记
论文笔记
论文阅读
人工智能
深度学习
[
论文笔记
] LLaVA
一、LLaVA论文中的主要工作和实验结果ExistingGap:之前的大部分工作都在做模态对齐,做图片的representationlearning,而没有针对ChatBot(多轮对话,指令理解)这种场景优化。Contribution:这篇工作已经在BLIP-2之后了,所以Image的理解能力不是LLaVA希望提升的重点,LLaVA是想提升多模态模型的Instruction-Followingab
心心喵
·
2024-09-03 08:53
论文笔记
论文阅读
[
论文笔记
] LLM模型剪枝
AttentionIsAllYouNeedButYouDon’tNeedAllOfItForInferenceofLargeLanguageModelsLLaMA2在剪枝时,跳过ffn和跳过fulllayer的效果差不多。相比跳过ffn/fulllayer,跳过attentionlayer的影响会更小。跳过attentionlayer:7B/13B从100%参数剪枝到66%,平均指标只下降1.7~
心心喵
·
2024-09-03 08:53
论文笔记
论文阅读
剪枝
算法
【
论文笔记
】Training language models to follow instructions with human feedback B部分
TraininglanguagemodelstofollowinstructionswithhumanfeedbackB部分回顾一下第一代GPT-1:设计思路是“海量无标记文本进行无监督预训练+少量有标签文本有监督微调”范式;模型架构是基于Transformer的叠加解码器(掩码自注意力机制、残差、Layernorm);下游各种具体任务的适应是通过在模型架构的输出后增加线性权重WyW_{y}Wy实
Ctrl+Alt+L
·
2024-09-02 01:12
大模型论文整理
论文笔记
论文阅读
语言模型
人工智能
自然语言处理
【
论文笔记
】:LAYN:用于小目标检测的轻量级多尺度注意力YOLOv8网络
背景针对嵌入式设备对目标检测算法的需求,大多数主流目标检测框架目前缺乏针对小目标的具体改进,然后提出的一种轻量级多尺度注意力YOLOv8小目标检测算法。小目标检测精度低的原因随着网络在训练过程中的加深,检测到的目标容易丢失边缘信息和灰度信息等。获得高级语义信息也较少,图像中可能存在一些噪声信息,误导训练网络学习不正确的特征。映射到原始图像的感受野的大小。当感受野相对较小时,空间结构特征保留较多,但
hhhhhhkkkyyy
·
2024-09-01 10:39
论文阅读
目标检测
YOLO
激光SLAM--(8) LeGO-LOAM
论文笔记
论文标题:LeGO-LOAM:LightweightandGround-OptimizedLidarOdometryandMappingonVariableTerrain应用在可变地形场景的轻量级的、并利用地面优化的LOAMABSTRACT轻量级的、基于地面优化的LOAM实时进行六自由度位姿估计,应用在地面的车辆上。强调应用在地面车辆上是因为在这里面要求雷达必须水平安装,而像LOAM和LIO-SA
lonely-stone
·
2024-08-30 20:29
slam
激光SLAM
论文阅读
论文浅尝 - AAAI2020 | 迈向建立多语言义元知识库:用于 BabelNet Synsets 义元预测...
论文笔记
整理:潘锐,天津大学硕士。来源:AAAI2020链接:https://arxiv.org/pdf/1912.01795.pdf摘要义原被定义为人类语言的最小语义单位。
开放知识图谱
·
2024-08-30 07:35
机器学习
人工智能
知识图谱
自然语言处理
深度学习
[
论文笔记
] LLM数据集——LongData-Corpus
https://huggingface.co/datasets/yuyijiong/LongData-Corpus1、hf的数据在开发机上要设置sshkey,然后cat复制之后在设置在hf上2、中文小说数据在云盘上清华大学云盘下载:#!/bin/bash#BaseURLbase_url="https://cloud.tsinghua.edu.cn/d/0670fcb14d294c97b5cf/fi
心心喵
·
2024-08-29 10:17
论文笔记
服务器
ubuntu
linux
[
论文笔记
] eval-big-refactor lm_eval 每两个任务使用一个gpu,并保证端口未被使用
1.5B在eval时候两个任务一个gpu是可以的。7B+在evalbelebele时会OOM,所以分配时脚本不同。eval_fast.py:importsubprocessimportargparseimportosimportsocket#参数列表task_name_list=["flores_mt_en_to_id","flores_mt_en_to_vi","flores_mt_en_to_
心心喵
·
2024-08-28 19:00
论文笔记
restful
后端
【
论文笔记
】Separating the “Chirp” from the “Chat”: Self-supervised Visual Grounding of Sound and Language
Abstract提出了DenseAV,一种新颖的双编码器接地架构,仅通过观看视频学习高分辨率、语义有意义和视听对齐的特征。在没有明确的本地化监督的情况下,DenseAV可以发现单词的"意义"和声音的"位置"。此外,它在没有监督的情况下自动发现并区分这两种类型的关联。DenseAV的定位能力源于一种新的多头特征聚合算子,该算子直接比较稠密的图像和音频表示进行对比学习。相比之下,许多其他学习"全局"音
xhyu61
·
2024-08-26 14:46
机器学习
学习笔记
论文笔记
论文阅读
图形学
论文笔记
文章目录PBD:XPBD:shapematchingPBD:【深入浅出NvidiaFleX】(1)PositionBasedDynamics最简化的PBD(基于位置的动力学)算法详解-论文原理讲解和太极代码最简化的PBD(基于位置的动力学)算法详解-论文原理讲解和太极代码XPBD:基于XPBD的物理模拟一条龙:公式推导+代码+文字讲解(纯自制)【论文精读】XPBD基于位置的动力学XPBD论文解读(
Jozky86
·
2024-08-25 18:10
图形学
图形学
笔记
stable diffusion和GAN网络的区别,优点缺点是什么
稳定扩散是一种无监督学习方法,用于图像
超分辨
率重建。它基于扩散过程模型,通过在不同的时间步骤中对图像进行重建来增加分辨率。该方法能够有效地增加图像的细节,并产生更高质量的图像。
爱好很多的算法工程师
·
2024-08-23 09:15
SD大模型AIGC
笔记
【视觉三维重建】【
论文笔记
】Deblurring 3D Gaussian Splatting
去模糊的3D高斯泼溅,看Demo比3D高斯更加精细,对场景物体细节的还原度更高,[官网](https://benhenryl.github.io/Deblurring-3D-Gaussian-Splatting/)背景技术Volumetricrendering-basednerualfields:NeRF.Rasterizationrendering:3D-GS.Rasterization比vol
CS_Zero
·
2024-03-12 05:51
论文阅读
[
论文笔记
] Transformer-XL
这篇论文提出的Transformer-XL主要是针对Transformer在解决长依赖问题中受到固定长度上下文的限制,如Bert采用的Transformer最大上下文为512(其中是因为计算资源的限制,不是因为位置编码,因为使用的是绝对位置编码正余弦编码)。Transformer-XL能学习超过固定长度的依赖性,而不破坏时间一致性。它由段级递归机制和一种新的位置编码方案组成。该方法不仅能够捕获长期
心心喵
·
2024-03-08 14:09
论文笔记
transformer
深度学习
人工智能
(condition instance batchnorm)A LEARNED REPRESENTATION FOR ARTISTIC STYLE
而对于图像
超分辨
率这种需要
水球喵
·
2024-03-02 13:35
SimpleShot: Revisiting Nearest-Neighbor Classification for Few-Shot Learning
论文笔记
前言目前大多数小样本学习器首先使用一个卷积网络提取图像特征,然后将元学习方法与最近邻分类器结合起来,以进行图像识别。本文探讨了这样一种可能性,即在不使用元学习方法,而仅使用最近邻分类器的情况下,能否很好地处理小样本学习问题。本文发现,对图像特征进行简单的特征转换,然后再进行最近邻分类,也可以产生很好的小样本学习结果。比如,使用DenseNet特征的最近邻分类器,在结合均值相减(meansubtra
头柱碳只狼
·
2024-02-24 10:28
小样本学习
多模态相关
论文笔记
(cilp)LearningTransferableVisualModelsFromNaturalLanguageSupervision从自然语言监督中学习可迁移的视觉模型openAI2021年2月48页PDFCODECLIP(ContrastiveLanguage-ImagePre-Training)对比语言图像预训练模型引言它比ImageNet模型效果更好,计算效率更高。尤其是zero-sho
靖待
·
2024-02-24 10:27
大模型
人工智能
论文阅读
【
论文笔记
· PFM】Lag-Llama: Towards Foundation Models for Time Series Forecasting
Lag-Llama:TowardsFoundationModelsforTimeSeriesForecasting摘要本文提出Lag-Llama,在大量时间序列数据上训练的通用单变量概率时间序列预测模型。模型在分布外泛化能力上取得较好效果。模型使用平滑破坏幂律(smoothlybrokenpower-laws)。介绍目前任务主要集中于在相同域的数据上训练模型。当前已有的大规模通用模型在大规模不同数
lokol.
·
2024-02-20 08:49
论文笔记
论文阅读
llama
【
论文笔记
】Unsupervised Learning of Video Representations using LSTMs
摘要翻译我们使用长短时记忆(LongShortTermMemory,LSTM)网络来学习视频序列的表征。我们的模型使用LSTM编码器将输入序列映射到一个固定长度的表征向量。之后我们用一个或多个LSTM解码器解码这个表征向量来实现不同的任务,比如重建输入序列、预测未来序列。我们对两种输入序列——原始的图像小块和预训练卷积网络提取的高层表征向量——都做了实验。我们探索不同的设计选择,例如解码器的LST
奶茶不加糖え
·
2024-02-20 08:25
lstm
深度学习
自然语言处理
MOSSE算法
论文笔记
以及代码解释
论文《VisualObjectTrackingusingAdaptiveCorrelationFilters》代码github1.论文idea提出以滤波器求相关的形式,找到最大响应处的位置,也就是我们所跟踪的目标的中心,进而不断的更新跟踪目标框和滤波器。2.跟踪策略如图,根据初始帧圈出的目标框训练滤波器,最大响应处为目标框的中心点,当移动到下一帧时,根据滤波器求相关的算法获得最大响应值,进而得出下
five days
·
2024-02-20 06:51
计算机视觉
深度学习
机器学习
Stable Diffusion系列(六):原理剖析——从文字到图片的神奇魔法(潜空间篇)
概述原理模型架构自编码器模型扩散模型条件引导模型图像生成过程实验结果指标定义IS(越大越好)FID(越小越好)训练成本与采样质量分析不带条件的图片生成基于文本的图片生成基于语义框的图片生成基于语义图的图片生成
超分辨
率图像生成图像重绘其他文生图模型
羊城迷鹿
·
2024-02-20 01:36
多模态模型
stable
diffusion
latent
潜空间
论文
Attention Is All Your Need
论文笔记
论文解决了什么问题?提出了一个新的简单网络架构——transformer,仅仅是基于注意力机制,完全免去递推和卷积,使得神经网络训练地速度极大地提高。Weproposeanewsimplenetworkarchitecture,theTransformer,basedsolelyonattentionmechanisms,dispensingwithrecurrenceandconvolution
xiaoyan_lu
·
2024-02-19 13:09
论文笔记
论文阅读
ESRGAN:基于GAN的增强
超分辨
率方法(附代码解析)
作者丨左育莘学校丨西安电子科技大学研究方向丨计算机视觉之前看的文章里有提到GAN在图像修复时更容易得到符合视觉上效果更好的图像,所以也是看了一些结合GAN的图像修复工作。ESRGAN:EnhancedSuper-ResolutionGenerativeAdversarialNetworks发表于ECCV2018的Workshops,作者在SRGAN的基础上进行了改进,包括改进网络的结构、判决器的判
PaperWeekly
·
2024-02-14 17:04
[
超分辨
率重建]ESRGAN算法训练自己的数据集过程
一、下载数据集及项目包1.数据集1.1文件夹框架的介绍,如下图所示:主要有train和val,分别有高清(HR)和低清(LR)的图像。1.2原图先通过分割尺寸的脚本先将数据集图片处理成两个相同的图像组(HR和LR)。如训练x4的ESRGAN模型,那么我们需要将HR的图像尺寸与LR的图像尺寸比例是4:1。在我的训练中,我将HR的图像尺寸分割成了480x480,LR的图像分割成了120x120。如下图
Cr_南猫
·
2024-02-14 17:02
超分辨率重建
超分辨率重建
人工智能
深度学习
论文笔记
:相似感知的多模态假新闻检测
整理了RecSys2020ProgressiveLayeredExtraction:ANovelMulti-TaskLearningModelforPersonalizedRecommendations)论文的阅读笔记背景模型实验论文地址:SAFE背景 在此之前,对利用新闻文章中文本信息和视觉信息之间的关系(相似性)的关注较少。这种相似性有助于识别虚假新闻,例如,虚假新闻也许会试图使用不相关的图
图学习的小张
·
2024-02-11 19:11
论文笔记
论文阅读
python
[论文总结] 深度学习在农业领域应用
论文笔记
12
文章目录1.3D-ZeF:A3DZebrafishTrackingBenchmarkDataset(CVPR,2020)摘要背景相关研究所提出的数据集方法和结果个人总结2.Automatedflowerclassificationoveralargenumberofclasses(ComputerVision,Graphics&ImageProcessing,2008)摘要背景分割与分类数据集和实
落痕的寒假
·
2024-02-11 12:26
论文总结
深度学习
论文阅读
人工智能
第十八篇【传奇开心果短博文系列】Python的OpenCV库技术点案例示例:图像修复和恢复
插值方法示例代码三、基于纹理合成的方法示例代码四、基于边缘保持的方法示例代码五、基于图像修复模型的方法示例代码六、基于深度学习的方法示例代码七、基于结构化边缘的方法示例代码八、基于多帧图像的方法示例代码九、基于
超分辨
率的方法示例代码十
传奇开心果编程
·
2024-02-11 07:53
Python库OpenCV
技术点案例示例短博文
python
opencv
计算机视觉
人工智能
论文笔记
之LINE:Large-scale Information Network Embedding
原文:LINE:Large-scaleInformationNetworkEmbedding本文提出一种新的networkembeddingmodel:LINE.能够处理大规模的各式各样的网络,比如:有向图、无向图、有权重图、无权重图.文中指出对于networkembedding问题,需要保留localstructure和globalstructure,分别对应first-orderproximi
小弦弦喵喵喵
·
2024-02-11 03:13
【深度学习】实验7布置,图像
超分辨
清华大学驭风计划因为篇幅原因实验答案分开上传,实验答案链接http://t.csdnimg.cn/P1yJF如果需要更详细的实验报告或者代码可以私聊博主有任何疑问或者问题,也欢迎私信博主,大家可以相互讨论交流哟~~深度学习训练营案例7:图像
超分辨
相关知识点
X.AI666
·
2024-02-11 03:00
深度学习
深度学习
人工智能
【深度学习】实验7实验结果,图像
超分辨
,如果需要详细的实验报告或者代码可以私聊博主,接实验技术指导1对1实验要求布置请看http://t.csdnimg.cn/jCsv6Model实现说明代码实现了一个基于生成对抗网络(SRGAN)的图像
超分辨
率模型
X.AI666
·
2024-02-10 11:05
深度学习
深度学习
人工智能
打败一切NeRF! 3D Gaussian Splatting 的 简单入门知识
新手的
论文笔记
3DGaussianSplatting的笔记introductionRelatedwork预备知识Gaussiansplatting3D高斯泼溅原理Overview3DGaussianSplatting
Ci_ci 17
·
2024-02-10 10:48
3d
python
《Residual Bi-Fusion Feature Pyramid Network for Accurate Single-shot Object Detection》
论文笔记
参考代码:无1.概述导读:在检测任务中一般会引入FPN增强在不同尺度下网络的检测性能,但是只通过top-down的FPN网络是很难去重建由于特征图的漂移(水平或是垂直方向运动)在经过pooling操作(pooling不具有平移不变性)带来结果相差很大的问题(特别针对小目标),而且FPN带来的性能提升会在使用较多卷积层之后逐渐被稀释(卷积的平移不变形),进而会导致一些小目标定位性能降低。对此可以通过
m_buddy
·
2024-02-09 18:37
#
General
Object
Detection
Bi-Fusion
论文笔记
-Generative Adversarial Nets
论文链接:https://papers.nips.cc/paper/2014/file/5ca3e9b122f61f8f06494c97b1afccf3-Paper.pdf论文解读:https://www.bilibili.com/video/BV1rb4y187vD?share_source=copy_web一句话总结:提出了生成模型框架GAN,包括一个生成模型G和一个判别模型D,用有监督的损失
升不上三段的大鱼
·
2024-02-09 05:49
论文笔记
:NIPS 2020 Graph Contrastive Learning with Augmentations
前言本文主要提出在图对比学习大框架下的图数据增强的若干方法。概括来说,本文提出了一种图对比学习框架来无监督的完成图表示学习,首先作者提出了基于各种先验信息的四种图数据增强方法。然后,作者分析了在四种不同的图数据增强条件下,不同组合对多个数据集的影响:半监督、无监督、迁移学习以及对抗性攻击。作者为GNN的预训练提出了基于图数据增强的对比学习框架来解决图中数据异质性的挑战,本文的主要贡献如下:作者提出
饮冰l
·
2024-02-09 00:54
图
弱监督
数据挖掘
机器学习
神经网络
深度学习
YOLOv8改进 | 检测头篇 | 独创RFAHead检测头
超分辨
率重构检测头(适用Pose、分割、目标检测)
一、本文介绍本文给大家带来的改进机制是RFAHead,该检测头为我独家全网首发,本文主要利用将空间注意力机制与卷积操作相结合的卷积RFAConv来优化检测头,其核心在于优化卷积核的工作方式,特别是在处理感受野内的空间特征时。RFAConv主要的优点就是增加模型的特征提取能力,这对于对于那些数据集中有困难识别的样本来说是非常有效的解决方法,同时本文的检测头结构为我本人独家提出,全网仅此一份,结构非常
Snu77
·
2024-02-07 08:25
YOLOv8有效涨点专栏
YOLO
目标检测
人工智能
深度学习
计算机视觉
python
Pytorch
论文笔记
-vChain: Enabling Verifiable Boolean Range Queries over Blockchain Databases
核心方法:提出了一种基于累加器的可认证数据结构,可以动态聚合任意查询属性提出块内和块间索引,聚合块内和块间数据,可以做高效查询验证倒排前缀树结构,加速同时处理大量数据的订阅查询提出问题:1.range查询2.布尔查询3.没有可靠第三方、而且不能保证查询的完整性图中元素有:①全节点②矿工节点:是全节点,而且负责构建共识证明,比如计算nonce③轻节点:存nonce、区块的哈希,不存数据记录提出的Vc
qq_40431700
·
2024-02-06 16:38
笔记
区块链
ESRGAN:基于GAN的增强
超分辨
率方法(附代码解析)
之前看的文章里有提到GAN在图像修复时更容易得到符合视觉上效果更好的图像,所以也是看了一些结合GAN的图像修复工作。ESRGAN:EnhancedSuper-ResolutionGenerativeAdversarialNetworks发表于ECCV2018的Workshops,作者在SRGAN的基础上进行了改进,包括改进网络的结构、判决器的判决形式,以及更换了一个用于计算感知域损失的预训练网络。
无止境x
·
2024-02-06 00:28
Super
Resolution(超分辨)
ESRGAN
论文笔记
--Improving Language Understanding by Generative Pre-Training
论文笔记
GPT1--ImprovingLanguageUnderstandingbyGenerativePre-Training1.文章简介2.文章导读2.1概括2.2文章重点技术2.2.1无监督预训练
Isawany
·
2024-02-05 15:20
论文阅读
论文阅读
自然语言处理
chatgpt
语言模型
nlp
最新
论文笔记
(+21):Privacy-Preserving Byzantine-Robust Federated Learning via Blockchain Systems/ TIFS2022
Privacy-PreservingByzantine-RobustFederatedLearningviaBlockchainSystems可译为“利用区块链实现隐私保护的拜占庭鲁棒性联邦学习”这篇是今年八月份被TIFS2022(CCFA)收录的文章,写的利用全同态加密和区块链技术解决联邦学习中隐私问题和可信问题(虽然区块链仅仅只是存储的作用,也稍微提了一下)。精读完这篇文章,整体感觉还不错,毕
cryptocxf
·
2024-02-05 10:24
论文笔记
联邦学习
论文阅读
区块链
一种通过增强的面部边界实现精确面部表示的多级人脸
超分辨
率
提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档文章目录摘要Abstract文献阅读:一种通过增强的面部边界实现精确面部表示的多级人脸
超分辨
率二、使用步骤1、研究背景2、方法提出3、相关方法
qq_43314576
·
2024-02-04 20:57
人工智能
机器学习
深度学习
Encoder-based Domain Tuning for Fast Personalization of Text-to-Image Models——【
论文笔记
】
本文是发表于ACMTransactionsonGraphics期刊上的一篇论文论文地址:[2302.12228]基于编码器的域优化,用于文本到图像模型的快速个性化(arxiv.org)官方代码:mkshing/e4t-diffusion:实现基于编码器的域调优,以实现文本到图像模型的快速个性化(github.com)一、Introduction近年来,个性化大规模文本到图像模型的能力已经彻底改变了
我是浮夸
·
2024-02-04 14:51
论文笔记
论文阅读
深度学习
人工智能
stable
diffusion
图像处理
SVDiff: Compact Parameter Space for Diffusion Fine-Tuning——【
论文笔记
】
本文发表于ICCV2023论文地址:ICCV2023OpenAccessRepository(thecvf.com)官方代码:mkshing/svdiff-pytorch:Implementationof"SVDiff:CompactParameterSpaceforDiffusionFine-Tuning"(github.com)一、Introduction最近几年,基于扩散的文本到图像生成模型
我是浮夸
·
2024-02-04 14:19
论文笔记
论文阅读
深度学习
图像处理
stable
diffusion
论文浅尝 | 动态知识图谱对齐
论文笔记
整理:谭亦鸣,东南大学博士生来源:AAAI‘21链接:https://ojs.aaai.org/index.php/AAAI/article/view/16585概述本文提出了一种动态图谱(KG
开放知识图谱
·
2024-02-04 07:05
算法
python
机器学习
人工智能
java
(2021|NIPS,VQ-VAE,精度瓶颈松弛,三明治层归一化,CapLoss)CogView:通过转换器掌握文本到图像的生成
公众号:EDPJ(添加VX:CV_EDPJ或直接进Q交流群:922230617获取资料)目录0.摘要1.简介2.方法2.1理论2.2标记化2.3自回归Transformer2.4训练的稳定性3.微调3.1
超分辨
率
EDPJ
·
2024-02-03 19:18
论文笔记
transformer
深度学习
人工智能
《Revisiting Self-Supervised Monocular Depth Estimation》
论文笔记
参考代码:rmd1.概述介绍:回顾前几年的一些自监督型深度估计算法,它们都是从不同的角度对自监督深度估计方法进行改进。总结这些算法中对自监督深度估计的改进idea,发现这些算法有的是为了解决场景光照变化对深度估计稳定性的影响;有的是对相机运动下场景中物体遮挡运动进行建模,从而减少对于前期假设先验的违背的影响。而这些改进的idea它们的来源是不同的文章,那么它们组合起来是否能达到比原方法更好的效果呢
m_buddy
·
2024-02-02 20:59
#
Depth
Estimation
self-supervised
depth
《LeReS:Learning to Recover 3D Scene Shape from a Single Image》
论文笔记
参考代码:AdelaiDepth-LeReS1.概述介绍:基于单张图像的深度估计网络往往采用scale-shiftinvariant形式完成深度预测,其是将预测深度和GT深度映射到scale-shiftinvariant空间,之后再计算loss,自然使用该方法得到的深度在经过点云映射之后是存在扭曲的,这类方法以MiDaS为代表。除scale-shift之外其还存在焦距(focal)上的不确定,因而
m_buddy
·
2024-02-02 20:29
#
Depth
Estimation
3d
计算机视觉
深度学习
LeReS
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他