超分辨论文笔记

Pytorch实现之对称卷积神经网络结构实现超分辨率

简介简介：针对传统的超分辨率重建技术所重建的图像过于光滑且缺乏细节的问题，作者提出了一种改进的生成对抗图像超分辨率网络。

这张生成的图像能检测吗·2025-03-26 17:51

（附论文笔记+项目源码+训练技巧）

摘要：从被嘲“调参侠”到GitHub万星大佬，我花了487天吃透大模型技术栈。用14张思维导图+32个实战项目，拆解出普通人可复制的进阶路径，文末送《大模型学习大礼包》（含2TB预训练数据+行业白皮书）。一、为什么你的大模型学习总是卡壳？2023行业调查报告显示：92%学习者停滞在微调阶段，核心痛点集中在：论文看不懂：Transformer源码像天书环境配不好：CUDA版本冲突天天报错算力不够用：

大模型入门教程·2025-03-25 01:17

Description of a Poisson Imagery Super Resolution Algorithm 论文阅读

DescriptionofaPoissonImagerySuperResolutionAlgorithm1.研究目标与意义1.1研究目标1.2实际意义2.创新方法与模型2.1核心思路2.2关键公式与推导2.2.1贝叶斯框架与概率模型2.2.2MAP估计的优化目标2.2.3超分辨率参数

青铜锁00·2025-03-23 17:50

RTX 4090旗舰显卡效能实战剖析

本文将通过多维度实测数据，系统解析其核心性能：首先聚焦8K游戏帧率与光线追踪效果的实战表现，结合DLSS3.0技术的动态对比，揭示超分辨率技术对高负载场景的优化逻辑；随后深入探讨24GBGDDR6X显存在视频渲染与

智能计算研究中心·2025-03-23 15:25

CVPR 2024 | 低分辨率引领方向：通过自监督学习提升超分辨率的泛化能力

Low-ResLeadstheWay:ImprovingGeneralizationforSuper-ResolutionbySelf-SupervisedLearning低分辨率引领方向：通过自监督学习提升超分辨率的泛化能力作者

小白学视觉·2025-03-21 10:57

论文笔记-Contrastive Learning for Unpaired Image-to-Image Translation

论文信息标题：ContrastiveLearningforUnpairedImage-to-ImageTranslation作者：TaesungPark,AlexeiA.Efros,RichardZhang,Jun-YanZhu机构：UniversityofCalifornia,Berkeley;AdobeResearch代码链接https://github.com/taesungp/contra

kingsleyluoxin·2025-03-19 18:55

基于生成对抗网络（GAN）的图像超分辨率实战：从SRGAN到ESRGAN

图像超分辨率（ImageSuper-Resolution）是一种通过算法将低分辨率图像转换为高分辨率图像的技术，广泛应用于医学影像、卫星图像和视频增强等领域。

Evaporator Core·2025-03-18 20:57

论文笔记：Deep Algorithm Unrolling for Blind Image Deblurring

这是一篇CVPR2020的去模糊论文，主要是通过传统与深度相结合，将迭代次数变成神经网络的层数，使网络结构的网络结构更加具有解释性。主要贡献：DeepUnrollingforBlindImageDeblurring(DUBLID)：提出一种可解释的神经网络结构叫做DUBLID，首先提出一种迭代算法，该算法被认为是梯度域中传统的广义全变分正则方法(generalizedTV-regularizeda

爱学习的小菜鸡·2025-03-18 09:55

A survey on instance segmentation: state of the art——论文笔记

摘要这篇论文综述了实例分割的研究进展，定义其为同时解决对象检测和语义分割的问题。论文讨论了实例分割的背景、面临的挑战、技术演变、常用数据集，并总结了相关领域的最新成果和未来研究方向。实例分割的发展从粗略的对象分类逐步演变为更精细的像素级别推理，广泛应用于自动驾驶、机器人等领域。论文为研究人员提供了对实例分割领域的全面了解和有价值的参考。一、简介第一部分“简介”主要介绍了实例分割的背景、定义和挑战。

栀子清茶·2025-03-17 06:54

HiPixel开源AI驱动的图像超分辨率的原生macOS 应用程序，使用 SwiftUI 构建并利用 Upscayl 强大的 AI 模型

一、软件介绍文末提供程序和源码下载HiPixel是一个开源程序基于SwiftUI构建的macOS原生应用程序，用于AI驱动的图像超分辨率，并利用Upscayl的强大AI模型。

2301_78755287·2025-03-14 19:43

AIGC视频生成模型：ByteDance的PixelDance模型

好评笔记·2025-03-11 21:09

NTIRE比赛：技术前沿、国内企业表现与计算机视觉未来展望

其竞赛内容涵盖图像超分辨率、

AndrewHZ·2025-03-11 19:21

LLM论文笔记 20: How to think step-by-step: A mechanistic understanding of chain-of-thought reasoning

Arxiv日期：2024.5.16机构：IIT关键词CoT本质LLM推理本质核心结论1.CoT推理的功能组件尽管不同阶段的推理任务具有不同的推理需求，模型内部的功能组件几乎是相同的（共享而非独享）不同的神经算法实际上是由类似归纳头（inductionheads）等机制组合而成2.注意力机制中的信息流动attentionheads在不同的模型层之间传递信息，特别是当它们涉及到本体论相关（ontolo

Zhouqi_Hua·2025-03-11 03:10

PSPNet在图像超分辨率中的应用

PSPNet在图像超分辨率中的应用1.背景介绍图像超分辨率(ImageSuper-Resolution,ISR)是计算机视觉领域的一个重要研究方向,旨在从低分辨率图像中重建高分辨率图像。

AI天才研究院·2025-03-10 12:55

[论文笔记] LLaMA3.1与Qwen2与Apple 技术报告中预训练方案对比

https://arxiv.org/pdf/2407.21075https://arxiv.org/pdf/2407.10671https://arxiv.org/pdf/2407.21783LLaMA3.1LLaMA3.1技术报告：https://ai.meta.com/blog/meta-llama-3-1/

心心喵·2025-03-10 01:02

LLM时代的小模型思考：《What is the Role of Small Models in the LLM Era: A Survey》论文笔记

论文：WhatistheRoleofSmallModelsintheLLMEra:ASurvey作者：LihuChenetal.单位：ImperialCollegeLondonAbstract问题：扩大模型大小会导致计算成本和能耗呈指数级增长，这使得这些模型对于学术研究人员和资源有限的企业来说不切实际小型模型（SMs）经常用于实际环境中，引发了关于小模型在LLM时代的作用的重要问题，且关注有限方法

FrancisQiu·2025-03-09 14:02

Pytorch实现之LSRGAN，轻量化SRGAN超分辨率SAR

论文题目：LightweightSuper-ResolutionGenerativeAdversarialNetworkforSARImages（SAR图像的轻量级超分辨率生成对抗网络）期刊：Remote

这张生成的图像能检测吗·2025-03-05 20:37

Pytorch实现之基于相对平均生成对抗网络的人脸图像超分辨率

简介简介：改进SRGAN，并使用相对平均生成对抗网络的人脸图像超分辨率训练自己的数据集论文题目：FaceImageSuper-resolutionBasedOnRelativeAverageGenerativeAdversarialNetworks

这张生成的图像能检测吗·2025-03-05 07:49

【论文笔记】3DGS压缩相关工作2篇

1.背景介绍：NVS神经辐射场（NeRFs）引入了一种基于多层感知机（MLP）的新型隐式场景表示方法，它将体密度编码作为几何形状和方向辐射的代理量。渲染通过光线行进的方式来执行。这一解决方案为新视图合成（NVS）带来了前所未有的视觉质量，但代价是训练多层感知机的优化过程极为耗时，且渲染速度很慢。有几种方法加速了训练和渲染过程，通常是利用空间数据结构或者像哈希这样的编码方式，不过牺牲了视觉质量。近期

AndrewHZ·2025-03-05 06:11

ECCV2024｜底层视觉(超分辨率，图像恢复，去雨，去雾，去模糊，去噪等)相关论文汇总（附论文链接/开源代码）【持续更新】

Kobaayyy·2025-03-03 02:55

[论文笔记] LLM大模型剪枝篇——2、剪枝总体方案

https://github.com/sramshetty/ShortGPT/tree/mainMy剪枝方案（暂定）：剪枝目标：1.5B—>100～600M剪枝方法：层粒度剪枝1、基于BI分数选择P%的冗余层，P=60~802、对前N%冗余层，直接删除fulllayer。N=20（N：剪枝崩溃临界点，LLaMA2在45%，Mistral-7B在35%，Qwen在20%，Phi-2在25%）对后(P

心心喵·2025-03-01 04:25

Farm3D- Learning Articulated 3D Animals by Distilling 2D Diffusion论文笔记

Farm3D:LearningArticulated3DAnimalsbyDistilling2DDiffusion1.Introduction最近的研究DreamFusion表明，可以通过text-imagegenerator提取高质量的三维模型，尽管该生成模型并未经过三维训练，但它仍然包含足够的信息以恢复三维形状。在本文中，展示了通过文本-图像生成模型可以获取更多信息，并获得关节模型化的三维对

Im Bug·2025-02-28 07:24

论文笔记（七十二）Reward Centering（一）

RewardCentering（一）文章概括摘要1奖励中心化理论文章概括引用：@article{naik2024reward,title={RewardCentering},author={Naik,AbhishekandWan,YiandTomar,MananandSutton,RichardS},journal={arXivpreprintarXiv:2405.09999},year={202

墨绿色的摆渡人·2025-02-26 21:20

论文笔记：Enhancing Sentence Embeddings in Generative Language Models

2024ICIC1INTRO对于文本嵌入，过去几年的相关研究主要集中在像BERT和RoBERTa这样的判别模型上。这些模型固有的语义空间各向异性，往往需要通过大量数据集进行微调，才能生成高质量的句子嵌入。——>需要较大的训练批次，这会消耗大量的计算资源一些前沿的工作将焦点转向了最近开发的生成模型，期望利用其先进的文本理解能力，直接对输入句子进行编码，而无需额外的反向传播由于句子表示和自回归语言建模

UQI-LIUWJ·2025-02-26 20:17

AI 在未来相机领域的应用前景如何？

以下是AI在手机相机中的关键潜力方向及具体应用场景：经典好文推荐，通过阅读本文，您将收获以下知识点:1.计算摄影的深度进化多帧合成与超分辨率：AI通过分析多张连续拍摄的帧（

程序员Android·2025-02-26 14:27

使用Diffusion Models进行图像超分辩重建

DiffusionModels专栏文章汇总：入门与实战前言：图像超分辨率重建是一个经典CV任务，其实LR（低分辨率）和HR（高分辨率）图像仅在高频细节上存在差异。

沉迷单车的追风少年·2025-02-25 04:32

从零开始Real-ESRGAN的复现

【论文阅读+测试】Real-Esrgan超分辨率算法_realesrgan-CSDN博客项目开始首先，我们要知道Real-E

晒阳光的咸鱼·2025-02-24 01:17

LLM论文笔记 15: Transformers Can Achieve Length Generalization But Not Robustly

Arxiv日期：2024.2.14机构：GoogleDeepMind/UniversityofToronto关键词长度泛化位置编码数据格式核心结论1.实验结论：十进制加法任务上的长度泛化最佳组合：FIRE位置编码随机化位置编码反向数据格式索引提示（indexhints，辅助定位）2.在适当的配置下，Transformer模型可以泛化到训练序列长度的2.5倍（例如从40位加法训练成功泛化到100位加

Zhouqi_Hua·2025-02-23 14:30

多模态论文笔记——DiT（Diffusion Transformer）

大家好，这里是好评笔记，公主号：Goodnote，专栏文章私信限时Free。本文详细介绍Transformer架构图像生成方面的应用，将Diffusion和Transformer结合起来的模型：DiT。目前DiT已经成为了AIGC时代的新宠儿，视频和图像生成不可缺少的一部分。文章目录论文定义架构与传统(U-Net)扩散模型区别架构噪声调度策略与传统扩散的相同输入图像/条件信息的Patch化（Pat

好评笔记·2025-02-23 04:19

南京大学联合字节开源视频超分辨率增强生成框架，视频清晰度一键提升，支持从低分辨率视频生成高分辨率视频

❤️如果你也关注AI的发展现状，且对AI应用开发非常感兴趣，我会每日分享大模型与AI领域的最新开源项目和应用，提供运行实例和实用教程，帮助你快速上手AI技术，欢迎关注我哦！微信公众号｜搜一搜：蚝油菜花快速阅读功能：STAR能够将低分辨率视频提升为高分辨率，恢复细节并保持时间一致性。技术：整合文本到视频扩散模型，引入局部信息增强模块和动态频率损失。应用：适用于影视制作、安防监控、运动员动作分析等多个

蚝油菜花·2025-02-21 05:45

一文读懂MUSIC算法DOA估计的数学原理并仿真

MUSIC（MultipleSignalClassification）算法于1979年由R.O.Schmidt提出，是阵列信号处理中广泛应用的经典DOA（DirectionofArrival）估计算法，凭借其超分辨的估计性能受到广泛关注

迎风打盹儿·2025-02-20 19:33

LLM论文笔记 14: The Impact of Positional Encoding on Length Generalization in Transformers

Arxiv日期：2023.12.15机构：McGillUniversity/IBM/Facebook/ServiceNow关键词长度泛化位置编码CoT核心结论1.decoder-only中不显式使用位置编码（NoPE）可以提高长度泛化性能2.（证明了）decoder-onlytransformer如果NoPE同时具备绝对APE和RPE的能力3.暂存器（cot）对于长度泛化和任务相关，同时关注短期和

Zhouqi_Hua·2025-02-20 07:15

LLM论文笔记 9: Neural Networks and the Chomsky Hierarchy

Arxiv日期：2022.9.29机构：GoogleDeepMind/Stanford关键词transformer架构原理乔姆斯基体系长度泛化核心结论1.虽然Transformer理论上具有图灵完备性，但在实践中能力受到位置不变性和有限记忆的限制2.Transformer在一些任务中表现较差，例如正则语言任务（如ParityCheck），表明其与Chomsky层级的对齐性不佳3.Transform

Zhouqi_Hua·2025-02-19 02:47

[论文笔记] Cost-Effective Hyperparameter Optimization for Large Language Model Generation 大型语言模型生成推理超参优化

成本效益高的大型语言模型生成推理的超参数优化https://openreview.net/pdf?id=DoGmh8A39OChiWang1,SusanXueqingLiu2,AhmedH.Awadallah11微软研究院，雷德蒙德2史蒂文斯理工学院摘要大型语言模型（LLMs）因其生成能力引发了广泛关注，催生了各种商业应用。使用这些模型的高成本驱使应用构建者在有限的推理预算下最大化生成的价值。本文

心心喵·2025-02-19 02:45

使用opencv实现深度学习的图片与视频的超分辨率

图片超分辨率什么是视频与图片的超分辨率，总结一下便是给一张分辨率比较低的图片，进行超分辨率的处理后，生成比较清晰的高分辨率的图片，上图图片完美解释了超分辨率的过程，由于不同的算法不同，处理的结果也不相同

人工智能研究所·2025-02-18 05:27

【deepseek】论文笔记--DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning

DeepSeek-R1论文解析1.论文基本信息标题：DeepSeek-R1:IncentivizingReasoningCapabilityinLLMsviaReinforcementLearning作者：DeepSeek-AI团队（联系邮箱：[email protected]）发表时间与出处：2024年，AIME2024（人工智能与数学教育国际会议）关键词：ReinforcementLe

大表哥汽车人·2025-02-15 02:40

PB 级别的大数据？

中国科研团队在超大容量超分辨三维光存储研究中取得突破性进展。

百态老人·2025-02-14 04:51

论文笔记《基于深度学习模型的药物-靶标结合亲和力预测》

基于深度学习模型的药物-靶标结合亲和力预测这是一篇二区的文章，算是一个综述，记录一下在阅读过程中遇到的问题。文章目录基于深度学习模型的药物-靶标结合亲和力预测前言一、蛋白质接触图谱二、为什么蛋白质图谱的准确性对DTA模型预测结果没有影响1.对这段话的解释2.关于Alphafold3三、随机配体与随机配体节点属性（配体一般指药物）1.什么是随机配体与配体节点属性四、关于深度学习模型对特征的自动学习过

I_dyllic·2025-02-14 03:57

TC-LLaVA论文笔记

RoPE介绍理解LLM位置编码:RoPE|LinsightMotivation在基于视频的multimodallargelanguagemodel中，更好地利用视频提供的时序信息。MethodTemporal-AwareDualRoPE之前的RoPE公式：A(qTm,kFnVz)=Re[qTmkFnVzei(P(Tm)−P(FnVz))θ]A_{(q_{T_m},k_{F_nV_z})}=Re[q

0yumiwawa0·2025-02-10 03:27

CNN-day5-经典神经网络LeNets5

经典神经网络-LeNets51998年YannLeCun等提出的第一个用于手写数字识别问题并产生实际商业（邮政行业）价值的卷积神经网络参考：论文笔记：Gradient-BasedLearningAppliedtoDocumentRecognition-CSDN

谢眠·2025-02-10 03:54

[论文笔记] llama3.2 蒸馏

参考链接：LLaMA3.2技术报告：GitHub-meta-llama/llama-stack:ModelcomponentsoftheLlamaStackAPIs[2407.21783]TheLlama3HerdofModelshttps://ai.meta.com/blog/llama-3-2-connect-2024-vision-edge-mobile-devices/HuggingFac

心心喵·2025-02-10 03:24

[论文笔记] Deepseek技术报告

1.总体概述背景与目标报告聚焦于利用强化学习（RL）提升大型语言模型（LLMs）的推理能力，旨在探索在不依赖大规模监督微调（SFT）的情况下，模型如何自我进化并形成强大的推理能力。介绍了两代模型：DeepSeek-R1-Zero（纯RL，无SFT冷启动数据）和DeepSeek-R1（在RL前加入少量冷启动数据和多阶段训练流程，提升可读性及推理表现）。核心思路直接在基础模型上应用大规模强化学习，利用

心心喵·2025-02-06 22:53

【YOLOv10改进[注意力]】引入2024.9的LIA(local importance-based attention,基于局部重要性的注意力) | 图像超分辨率任务

本文将进行在YOLOv10中引入2024.9.20的LIA模块魔改v10，文中含全部代码、详细修改方式。助您轻松理解改进的方法。目录一LIA二安装YOLO三魔改YOLOv101整体修改①添加python文件

Jackilina_Stone·2025-02-05 20:23

【论文笔记】基于图神经网络的多视角视觉重定位 GRNet CVPR 2020 论文笔记

GRNet:LearningMulti-viewCameraRelocalizationwithGraphNeuralNetworks驭势科技,北京大学机器感知重点实验室,北京长城航空测控技术研究所本文提出了一种使用多视角图像进行相机重定位的图神经网络。该网络可以使得不连续帧之间进行信息传递，相比于只能在相邻前后帧之间进行信息传递的序列输入和LTSM，其能捕获更多视角信息以进行重定位。因此LSTM

phy12321·2025-02-03 14:26

论文笔记（七十）DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning（二）

DeepSeek-R1:IncentivizingReasoningCapabilityinLLMsviaReinforcementLearning（二）文章概括摘要：2.方法2.3.DeepSeek-R1：冷启动强化学习2.3.1.冷启动2.3.2.面向推理的强化学习2.3.3.拒绝采样与监督微调2.3.4.面向所有场景的强化学习2.4.蒸馏：赋予小模型推理能力文章概括引用：@article{g

墨绿色的摆渡人·2025-01-31 07:01

【图像超分】论文复现：万字长文！Pytorch实现EDSR！代码修改无报错！踩坑全记录！适合各种深度学习新手！帮助你少走弯路！附修改后的代码和PSNR最优的模型权重文件！

第一次来请先看这篇文章：【超分辨率（Super-Resolution）】关于【超分辨率重建】专栏的相关说明，包含专栏简介、专栏亮点、适配人群、相关说明、阅读顺序、超分理解、实现流程、研究方向、论文代码数据集汇总等

十小大·2025-01-29 16:47

[论文总结] 深度学习在农业领域应用论文笔记14

当下，深度学习在农业领域的研究热度持续攀升，相关论文发表量呈现出迅猛增长的态势。但繁荣背后，质量却不尽人意。相当一部分论文内容空洞无物，缺乏能够落地转化的实际价值，“凑数”的痕迹十分明显。在农业信息化领域的顶刊《ComputersandElectronicsinAgriculture》中也大面积存在。众多论文在研究方法上存在严重缺陷，过于简单粗放。只是机械地把深度学习方法生硬地套用到特定农业问题中

落痕的寒假·2025-01-29 14:00

[论文笔记] llama-factory 微调qwen2.5、llama3踩坑

一、bug1、pre-tokenize的时候,会OOM解决：在yaml文件中添加streaming参数#tokenizestreaming:Truemax_steps:10000https://github.com/hiyouga/LLaMA-Factory/blob/3a023bca2a502810a436cfba7708df164754ea62/src/llamafactory/hparams

心心喵·2025-01-28 20:14

[论文笔记] Megatron: mistral sliding window（ImportError: /workspace/venv/lib/python3.10/site-packag报错解决）

pyTorch—TransformerEngine1.2.1documentation论文：https://arxiv.org/pdf/2310.06825.pdftransformerengine的slidingwindow是用了flashatttention（新版本2以上，这里用的最新版本2.5.2）里对sliding_window的实现。所以不需要用transformerengine。直接用

心心喵·2025-01-28 00:46

超分辨率体积重建实现术前前列腺MRI和大病理切片组织病理学图像的3D配准

摘要：磁共振成像（MRI）在前列腺癌诊断和治疗中的应用正在迅速增加。然而，在MRI上识别癌症的存在和范围仍然具有挑战性，导致即使是专家放射科医生在检测结果上也存在高度变异性。提高MRI上的癌症检测能力对于减少这种变异性并最大化MRI的临床效用至关重要。迄今为止，这种改进受到缺乏准确标注的MRI数据集的限制。通过接受根治性前列腺切除术的患者数据，可以将切除前列腺的数字化组织病理学图像与术前MRI进行

CVer儿·2025-01-24 07:13

推荐频道