三维重建论文阅读第3页

SCI论文写作训练营笔记汇总02_英文科技论文阅读与解析

SCI论文写作训练营笔记汇总02_英文科技论文阅读与解析持续创作，加速成长！

Dashesand·2024-02-02 02:18

论文阅读《SGNet: Structure Guided Network via Gradient-Frequency Awareness for Depth Map Super-Resolutio》

论文地址：https://arxiv.org/pdf/2312.05799v1.pdf源码地址：https://github.com/yanzq95/SGNet概述深度图的图像引导超分辨率在各个领域有着广泛的应用。但是，复杂的成像环境会导致深度图的结构边缘变得模糊。如图2所示，从梯度图可以看出，它能够很好地表现出图像的结构信息。从频谱图可以看出，高分辨率的深度图和RGB图像都包含了丰富的高频和

CV科研随想录·2024-02-01 17:54

A Generalized Unbiased Risk Estimator for Learning withAugmented Classes论文阅读

论文arxiv.org/pdf/2306.06894.pdfhttps://arxiv.org/pdf/2306.06894.pdf代码（使用的是华为mindspore框架）Shuijing2018/GLAC_Mindspore(github.com)https://github.com/Shuijing2018/GLAC_Mindspore最近的一项研究表明，通过利用未标记数据，可以在类别转移条

Mr___WQ·2024-02-01 15:42

三维重建开源函数库或者工具

三维重建使用摄影测量、计算机视觉技术，利用立体视觉恢复真实相机姿态，获取现实物体的三维信息，并进行虚拟三维场景重现。

冰清-小魔鱼·2024-02-01 14:16

【论文阅读笔记】Transformer-XL

Paper:Transformer-XL:AttentiveLanguageModelsBeyondaFixed-LengthContext重点关注论文中的相对位置编码及提高融合了相对位置信息的attentionscore的计算效率的部分。AbstractTransformer具有学习长依赖的能力，但受限于语言模型固定长度上下文的限定。本文提出的Transformer-XL神经网络架构可以在不打破

没啥信心·2024-02-01 12:16

论文阅读“A probabilistic framework for multi-view feature learning with many-to-many associations via...

OkunoA,HadaT,ShimodairaH.Aprobabilisticframeworkformulti-viewfeaturelearningwithmany-to-manyassociationsvianeuralnetworks[C]//InternationalConferenceonMachineLearning.PMLR,2018:3888-3897.预备知识这部分主要是为了介

掉了西红柿皮_Kee·2024-02-01 11:54

论文阅读：A visualized human-computer interactive approach to job shop scheduling

Avisualizedhuman-computerinteractiveapproachtojobshopscheduling作者：DongH.Baek、SangY.OH、WanC.Yoon期刊：COMPUTERINTEGRATEDMANUFACTURING、1999网络资源：Avisualizedhuman-computerinteractiveapproachtojobshopscheduli

还是要努力呀！·2024-02-01 08:30

【论文阅读笔记】Time Series Contrastive Learning with Information-Aware Augmentations

TimeSeriesContrastiveLearningwithInformation-AwareAugmentations摘要背景：在近年来，已经有许多对比学习方法被提出，并在实证上取得了显著的成功。尽管对比学习在图像和语言领域非常有效和普遍，但在时间序列数据上的应用相对较少。对比学习的关键组成部分：对比学习的一个关键组成部分是选择适当的数据增强（augmentation）方式，通过施加一些先

少写代码少看论文多多睡觉·2024-02-01 07:55

三维重建方法3D gaussian splatting与NeRF的区别和异同

Soumes·2024-02-01 06:14

【3DGS】从新视角合成到3D Gaussian Splatting

文章目录引言：什么是新视角合成任务定义一般步骤NeRF的做法NeRF的三维重建NeRF的渲染3DGS的三维重建从一组图片估计点云高斯点云模型球谐函数参数优化损失函数和协方差矩阵的优化高斯点的数量控制(AdaptiveDensityControl

UnderTurrets·2024-02-01 06:01

Transformer 代码补充

本文是对Transformer-Attentionisallyouneed论文阅读-CSDN博客以及【李宏毅机器学习】Transformer内容补充-CSDN博客的补充，是对相关代码的理解。

Karen_Yu_·2024-01-31 21:27

三维重建经典论文合集汇总

三维重建涉及计算机视觉、图形学等多门知识，是一套非常复杂的系统。

深蓝学院·2024-01-31 18:11

【三维重建】双目立体视觉

(极几何的基础知识可以参考这篇文章：【三维重建】对极几何-CSDN博客)平行视图中，可以利用视差就得深度，视差越小深度越深。如何得到平行视图呢？

Patrick star`·2024-01-31 18:11

【三维重建】三角化

三角化要解决的问题是：已知两个相机的内参K、K'、相机之间的旋转平移矩阵R、t以及匹配点p、p'，如何求得P点的三维坐标？线性解法C++代码实现:https://github.com/ldx-star/Triangulation.git

Patrick star`·2024-01-31 18:11

【三维重建】运动恢复结构（SfM）

欧式结构恢复(内参已知，外参未知)欧式结构恢复问题：已知：1、n个三维点在m张图像中的对应点的像素坐标2、相机内参求解：1、n个三维点坐标2、m个摄像机的外参数R、T通过极几何我们知道本质矩阵和基础矩阵【三维重建

Patrick star`·2024-01-31 18:10

论文阅读：A Survey of Embodied AI: From Simulators toResearch Tasks

介绍具身智能可粗略定义为，智能体（可以是生物或机械），通过与环境产生交互后，通过自身的学习，产生对于客观世界的理解和改造能力。具身智能假设，智能行为可以被具有对应形态的智能体通过适应环境的方式学习到。因此，地球上所有的生物，都可以说是具身智能。但就目前而言，具身智能是将视觉、语言和推理等传统智能概念融入人工智能体中，以帮助解决虚拟环境中的人工智能问题。具身智能模拟器具身智能模拟器具身AI模拟器概述

帅你一脸的臭宝·2024-01-31 10:59

MapReduce 论文阅读笔记 MapReduce 简介

论文：MapReduce:SimplifiedDataProcessingonLargeClustersJeffreyDeanandSanjayGhemawatGooglehttps://pdos.csail.mit.edu/6.824/papers/mapreduce.pdfMapReduce是一种分布式系统中处理大数据方法。他提出是在2004，jeffdean和SanjayGhemawat的作

RzBu11d023r·2024-01-31 04:34

论文阅读-MapReduce

论文名称：MapReduce:SimplifiedDataProcessingonLargeClusters翻译的效果不是很好，有空再看一遍，参照一下别人翻译的。MapReduce:SimplifiedDataProcessingonLargeClusters中文翻译版(转)-阿洒-博客园(cnblogs.com)概要MapReduce是一种处理和生成大数据集的编程模型和相关实现。用户可以指定一个

向来痴_·2024-01-31 04:31

特征选择综述论文阅读笔记

一特征选择（featureselection）的简介我们现在正处在大数据的时代，大量的高维数据在各种领域中无处不在，如社交媒体、医疗保健、生物信息学和在线教育。当数据挖掘和机器学习算法应用于高维数据时，一个关键问题被称为维数诅咒：数据在高维空间中变得更加稀疏，对为低维空间设计的算法产生不利影响的现象。用一个例子表示就是如果用one-hot编码来对文章进行编码（即一篇文章为一个正交向量），因

wyn20001128·2024-01-31 01:23

【论文阅读】HiNet Deep Image Hiding by Invertible Network

睡晚不猿序程·2024-01-30 23:37

【论文阅读】Long-Tailed Recognition via Weight Balancing（CVPR2022）附MaxNorm的代码

目录论文使用方法weightdecayMaxNorm如果使用原来的代码报错的可以看下面这个论文问题：真实世界中普遍存在长尾识别问题，朴素训练产生的模型在更高准确率方面偏向于普通类，导致稀有的类别准确率偏低。key:解决LTR的关键是平衡各方面，包括数据分布、训练损失和学习中的梯度。文章主要讨论了三种方法：L2normalization,weightdecay,andMaxNorm本文提出了一个两阶

鱼小丸·2024-01-30 20:38

论文阅读，Domain Specific ML Prefetcher for Accelerating Graph Analytics（一）

目录一、Article:文献出处（方便再次搜索）（1）作者（2）文献题目（3）文献时间（4）引用二、Data:文献数据（总结归纳，方便理解）（1）背景介绍（2）目的（3）预置知识（4）主要实现手段4.1overview4.2MPGraph的工作流程4.3阶段转换检测器PhaseTransitionDetector4.4多模态访存预测器Phase-SpecificMulti-ModalityPred

好啊啊啊啊·2024-01-30 20:08

【论文阅读|半监督小苹果检测方法S3AD】

论文题目：:Semi-supervisedSmallAppleDetectioninOrchardEnvironments项目链接：https://www.inf.uni-hamburg.de/en/inst/ab/cv/people/wilms/mad.html摘要（Abstract）农作物检测是自动估产或水果采摘等精准农业应用不可或缺的一部分。然而，由于缺乏大规模数据集以及图像中农作物的相对尺

Dymc·2024-01-30 18:07

【论文阅读|细胞实例分割算法ASF-YOLO】

论文题目：ASF-YOLO:AnovelYOLOmodelwithattentionalscalesequencefusionforcellinstancesegmentation论文链接：https://arxiv.org/abs/2312.06458代码链接：https://github.com/mkang315/ASF-YOLO摘要（Abstract）作者提出了一种新颖的基于"YouOnly

Dymc·2024-01-30 18:06

2022.5.24

上午除了上课，主要是听一个关于议论文阅读的讲座，讲得很用心。感

河南麦子的书写·2024-01-30 16:02

人体三维重建（六）——虚拟试衣方案

获得准确的三维人体模型通常是虚拟试衣的第一步，随后还需要合身且具有真实感的三维服装模拟。其中涉及的是人体与服装之间的交互技术以及服装建模技术（暂不考虑真实感渲染）。如图1所示。图1虚拟试衣的相关技术本次将关注一个虚拟试衣领域的热点问题，即如何高效复用现有的三维服装进行自动化服装生成、编辑或者是将其试穿到不同的三维人体身上进行服装的个性化定制。将现有工作分为基于几何优化的方法与基于数据驱动的方法，并

计算机视觉AI·2024-01-30 08:37

论文阅读[2023ToN]Joint Upload-Download Transmission Scheme for Low-Latency Mobile Live Video Streaming

JointUpload-DownloadTransmissionSchemeforLow-LatencyMobileLiveVideoStreaming会议信息：Publishedin:2023IEEE/ACM31stInternationalSymposiumonQualityofService(IWQoS)1背景移动视频流量和用户需求的快速增长，导致多个视频流客户端共享一个瓶颈链路的可能性增大

woshicaiji12138·2024-01-30 07:25

论文阅读[2023][ICCE]360DIV: 360° Video Plus Depth for Fully Immersive VR Experiences

360DIV:360°VideoPlusDepthforFullyImmersiveVRExperiences会议信息：Publishedin:2023IEEEInternationalConferenceonConsumerElectronics(ICCE)作者：1背景与挑战360°视频不提供运动视差，如图1所示。当观看者移动时，虚拟场景随之而动，这大大降低了体验的质量。在这项工作中，我们处理3

woshicaiji12138·2024-01-30 07:25

论文阅读_跨模态商品搜索FashionBERT

论文地址：https://arxiv.org/pdf/2005.09801v1.pdf《FashionBERT:TextandImageMatchingwithAdaptiveLossforCross-modalRetrieval》是一篇非常新的论文，于2020年5月20提交arxiv，文中在时尚领域使用自适应损失技术，实现了文本与图片的跨模态搜索（用文本搜图片、用图片搜文本）。早期的跨模态搜索常

xieyan0811·2024-01-30 01:05

Analysis of Learning from Positive and Unlabeled Data

PUlearning论文阅读。

zealscott·2024-01-29 14:53

【论文阅读】Vlogger: Make Your Dream A Vlog

Vlogger：把你的梦想变成Vlogpaper：https://arxiv.org/abs/2401.09414code：https://github.com/zhuangshaobin/vlogger看起来挺有意思的，有空读一下本文提出Vlogger，一种用于生成用户描述的分钟级视频博客(即vlog)的通用人工智能系统。与几秒钟的短视频不同，vlog通常包含复杂的故事情节和多样化的场景，这对大

李加号pluuuus·2024-01-29 09:35

【论文阅读】Membership Inference Attacks Against Machine Learning Models

基于confidencevector的MIAMachineLearningasaService简单介绍什么是MembershipInferenceAttacks（MIA）攻击实现过程DatasetShadowtrainingTrainattackmodelMachineLearningasaService简单介绍机器学习即服务（MachineLearningasaService，MLaaS），即将

PleaseBrave·2024-01-29 09:04

【李宏毅机器学习】Transformer 内容补充

本文用作Transformer-Attentionisallyouneed论文阅读-CSDN博客的补充内容，因为发现如果实操还是有不能理解的地方，所以准备看看宝可梦老师怎么说×Sel

Karen_Yu_·2024-01-29 08:57

[论文阅读] |RAG评估_Retrieval-Augmented Generation Benchmark

写在前面检索增强能够有效缓解大模型存在幻觉和知识时效性不足的问题，RAG通常包括文本切分、向量化入库、检索召回和答案生成等基本步骤。近期组里正在探索如何对RAG完整链路进行评估，辅助阶段性优化工作。上周先对评估综述进行了初步的扫描，本篇分享其中一份评估benchmark，RGB。论文：https://arxiv.org/abs/2309.01431代码和数据：https://github.com/

LiuHui*n·2024-01-29 07:28

论文阅读《Feature Transformation Ensemble Model with Batch Spectral Regularization for Cross-Domain Fe...

没想到上次的论文阅读更新是八月份哈哈哈哈说好这个月要好好更新的那就把之前没有更新出来的论文阅读补充一下还是小样本跨域系列哈~（由于之前阅读的时间有点久这边可能会放一些PPT）论文名称：《FeatureTransformationEnsembleModelwithBatchSpectralRegularizationforCross-DomainFew-ShotClassification

LiBiscuit·2024-01-29 01:50

【Image captioning】论文阅读八—ClipCap: CLIP Prefix for Image Captioning_2021

中文标题：ClipCap:CLIP前缀用于图像描述（ClipCap:CLIPPrefixforImageCaptioning）文章目录1.介绍2.相关工作3.方法3.1综述3.2语言模型微调3.3映射网络架构3.4推理4.结果5.结论摘要：图像描述是视觉语言理解中的一项基础任务，模型会对给定的输入图像预测出一段文本信息性描述。本文提出了一种简单的方法来解决这个任务。我们使用CLIP编码作为描述的前

安静到无声·2024-01-28 08:33

Efficient reversible data hiding for JPEG images with multiple histograms modification（论文阅读）

目录论文背景论文贡献基于未压缩图片的可逆数据隐藏现有的基于JEPG图像的可逆数据隐藏方法论文提出的方法一般论文都是先提出问题后解决问题，所以在阅读一篇论文的时候要清楚论文要解决的问题是什么？也就是论文背景，解决方案是什么？也就是论文贡献论文背景该论文是2020年发表的一篇SCI二区的文章，发表在IEEETransactionsonCircuitsandSystemsforVideoTechnolo

Nefelibat·2024-01-28 08:03

Structure-from-Motion Revisited(COLMAP) 流程介绍

.GUI运行Reference：Structure-from-MotionRevisited原文COLMAP使用教程Colmap论文——《Structure-from-MotionRevisited》论文阅读笔记笔记

泠山·2024-01-28 06:40

【论文阅读】Grasp-Anything: Large-scale Grasp Dataset from Foundation Models

文章目录Grasp-Anything:Large-scaleGraspDatasetfromFoundationModels针对痛点和贡献摘要和结论引言相关工作Grasp-Anything数据集实验-零镜头抓取检测实验-机器人评估总结Grasp-Anything:Large-scaleGraspDatasetfromFoundationModelsProjectpage：Grasp-Anythin

三木今天学习了嘛·2024-01-27 09:43

【论文阅读】GraspNeRF: Multiview-based 6-DoF Grasp Detection

文章目录GraspNeRF:Multiview-based6-DoFGraspDetectionforTransparentandSpecularObjectsUsingGeneralizableNeRF针对痛点和贡献摘要和结论引言模型框架实验不足之处GraspNeRF:Multiview-based6-DoFGraspDetectionforTransparentandSpecularObjec

三木今天学习了嘛·2024-01-27 09:43

VALLE：Neural Codec Language Models areZero-Shot Text to Speech Synthesizers---TTS论文阅读

笔记地址：https://flowus.cn/share/a94730c1-6ae8-4955-82fb-812aff78f638【FlowUs息流】VALLE论文地址：NeuralCodecLanguageModelsareZero-ShotTexttoSpeechSynthesizersAbstract这里介绍的是一种新的语言建模方法来完成文本到语音的合成。这种方法不同于传统的直接从文本转换到

pied_piperG·2024-01-27 09:42

论文阅读：EDPLVO: Efficient Direct Point-Line Visual Odometry

目录Abstract:Introductions：Relatedwork：LineMatch：Feature-basedMethod：WindowsOptimizationTwo-stepMinimizationV.FRONT-ENDVI.EXPERIMENTALRESULTSA.DatasetsandMetrics（数据集和指标）B.ComparisonwiththeState-of-the-a

稻壳特筑·2024-01-27 09:41

AI Infra论文阅读之通过打表得到训练大模型的最佳并行配置

目录0x0.前言0x1.摘要0x2.介绍0x3.背景0x4.实验设置0x5.高效的LLM训练分析0x5.1FusedKernels和FlashAttention0x5.1.1Attention0x5.1.2RMSNormKernel0x5.2ActivationCheckpointing0x5.3Micro-Batch大小0x5.4TensorParallelism和PiplineParallel

just_sort·2024-01-27 09:38

Tortoise-tts Better speech synthesis through scaling——TTS论文阅读

笔记地址：https://flowus.cn/share/a79f6286-b48f-42be-8425-2b5d0880c648【FlowUs息流】tortoise论文地址：BetterspeechsynthesisthroughscalingAbstract:自回归变换器和DDPM：自回归变换器（autoregressivetransformers）是一种基于变换器架构的模型，能够处理序列数据

pied_piperG·2024-01-27 09:38

论文阅读：TradeoffBased Interactive MultiObjective Optimization Method Driven by Evolutionary Algorithms

ATradeoff-BasedInteractiveMulti-ObjectiveOptimizationMethodDrivenbyEvolutionaryAlgorithms作者：LuChen、BinXin、JieChen期刊：JournalofAdvancedComputationalIntelligenceandIntelligentInformatics、2017DOI：10.20965

还是要努力呀！·2024-01-27 02:41

论文阅读：Interactive Multiobjective Optimization from a Learning Perspective

InteractiveMultiobjectiveOptimizationfromaLearningPerspective作者：ValerieBelton、JürgenBranke、PetriEskelinen书名：MultiobjectiveOptimization:InteractiveandEvolutionaryApproaches、2008DOI：10.1007/978-3-540-88

还是要努力呀！·2024-01-27 02:11

论文阅读：求解约束多目标区间优化的交互多属性决策NSGA-II算法

求解约束多目标区间优化的交互多属性决策NSGA-II算法作者：陈志旺,陈林,白锌,杨七,赵方亮期刊：控制与决策、2015.05DOI：10.13195/j.kzyjc.2014.0455内容简介针对约束多目标区间优化问题,提出一种交互多属性决策NSGA-II算法.该算法将非线性问题线性化,定义P占优支配关系求出个体的序值,定义区间拥挤距离来区分具有相同序值个体的优劣,采用约束精英策略删除种群中不满

还是要努力呀！·2024-01-27 02:40

【论文阅读笔记】Towards Universal Unsupervised Anomaly Detection in Medical Imaging

TowardsUniversalUnsupervisedAnomalyDetectioninMedicalImagingarxiv，19Jan2024【开源】【核心思想】本文介绍了一种新的无监督异常检测方法—ReversedAuto-Encoders(RA)，旨在提高医学影像中病理检测的准确性和范围。RA通过生成类似健康的重建图像，能够检测到更广泛的病理类型，这在现有技术中是一个挑战。RA方法在多

cskywit·2024-01-26 12:10

论文阅读《thanking frequency fordeepfake detection》

项目链接：https://github.com/yyk-wew/F3Net这篇论文从频域的角度出发，提出了频域感知模型用于deepfake检测的模型整体架构图：1.FAD：频域感知分解，其实就是利用DCT变换，将空间域转换为频域，变换后的图像低频信息在左上角，高频信息在右下角，同时高频表示细粒度的伪造痕迹，因为进过DCT变换后的图像不再具有尺度不变性和局部相关性的RGB图像特性，故需要对其进行ID

一只发呆的猪·2024-01-26 12:08

【Image captioning】论文阅读七—Efficient Image Captioning for Edge Devices_AAAI2023

中文标题：面向边缘设备的高效图像描述（EfficientImageCaptioningforEdgeDevices）文章目录1.引言2.相关工作3.方法3.1ModelArchitecture（模型结构）3.2ModelTraining(模型训练)3.3KnowledgeDistillation（知识蒸馏）4.实验4.1数据集和评价指标4.2实施细节：4.3消融实验

安静到无声·2024-01-26 11:30

推荐频道

三维重建论文阅读