深度之眼

2023扩散模型最新技术进展汇总

随着Stable Diffusion和Midjourney等图像生成模型的爆火，今年在模型领域，扩散模型稳占主导地位。因此，与之相关的新技术也层出不穷，短短1个月，扩散模型相关的论文就有上百篇了，可见其发展的火热趋势。

这次我整理了一部分最新扩散模型相关论文来和大家分享，有50+篇，希望能帮助同学们获取新的思路~

1.Hyperspectral and Multispectral Image Fusion Using the Conditional Denoising Diffusion Probabilistic Model

标题：多光谱图像和超光谱图像融合使用基于条件去噪扩散概率模型

内容：Hyperspectral 图像有大量光谱信息，但空间分辨率低。多光谱图像如 RGB 图像有高空间分辨率，但波段不足。图像融合目标是获得同时具有高空间分辨率和高光谱分辨率的图像。现有方法依赖已知的图像退化模型，但这在实际中常常不可用。

本文提出基于条件去噪扩散模型 DDPM-Fus 的深度融合方法。它包含正向添加高斯噪声的扩散过程，以及反向从噪声版本预测高分辨率 HSI 的去噪过程。训练完成后，在测试数据上实现反向过程，根据高分辨率 MSI 和低分辨率 HSI 生成融合的高分辨率 HSI。实验结果展示了与其他深度学习融合方法相比的优势。

2.IPO-LDM Depth-aided 360-degree Indoor RGB Panorama Outpainting via Latent Diffusion Model

标题：IPO-LDM：基于潜在扩散模型的深度辅助室内360度RGB全景图像补painting

内容：作者提出使用潜在扩散模型(LDM)进行室内360° RGB全景图像补 painting的方法。

论文主要贡献：

提出一种新颖的双模态潜在扩散结构，在训练时同时利用RGB和深度全景数据，但在推理时仅需要RGB图像就能进行出色的补painting。
在每个扩散反噪声步骤中引入渐进式相机旋转，大幅提升全景图像的环绕一致性。
与SOTA方法相比，该方法不仅全景RGB图像补painting效果显著提升，还可以为不同mask生成多个不同且结构合理的结果。

3.How to Detect Unauthorized Data Usages in Text-to-image Diffusion Models

标题：如何检测文本到图像扩散模型中的未经授权的数据用法

内容：这篇文章提出了一种通过在受保护的数据集上训练的文本到图像扩散模型中植入注入记忆，来检测未经授权的数据用法的方法。

主要工作如下：

在受保护的图像数据集上修改图片，增加难以被人眼察觉但可以被扩散模型捕捉并记忆的独特内容，如隐秘的图像包装函数。
通过分析模型是否对注入的内容有记忆(即生成的图像是否被选择的后处理函数处理过)，可以检测到非法使用未经授权数据训练的模型。
在Stable Diffusion和LoRA模型上的实验表明，该方法可以有效检测未经授权的数据用法。
该技术能够帮助保护艺术家的作品免受未经授权的使用。

4.Censored Sampling of Diffusion Models Using 3 Minutes of Human Feedback

标题：仅用3分钟人工反馈对Diffusion模型进行审查采样

内容：Diffusion模型最近在高质量图像生成方面取得了显著成功，但是，预训练的diffusion模型有时会表现出一定的失准，可以生成好的图像，但有时也会输出不可取的图像。如果出现这种情况，我们只需要阻止生成bad images，这就是审查(censoring)。在本文中，作者提出了一种方法，使用在极少人工反馈上训练的奖励模型来进行预训练diffusion模型的审查生成。结果表明，这种审查方式可以以极高的人工反馈效率实现，仅几分钟的人工反馈生成的标签就足以完成此任务。

5.Synthetic CT Generation from MRI using 3D Transformer-based Denoising Diffusion Model

标题：使用基于3D变压器的去噪扩散模型从MRI生成合成CT

内容：本文提出了一种MRI到CT的基于变压器的去噪扩散概率模型(MC-DDPM)，将MRI转换为高质量的sCT，以促进放射治疗计划。MC-DDPM通过带移位窗口的变压器网络实现了从MRI到sCT的扩散过程。该模型由两个过程组成：正向过程是在真实CT上添加高斯噪声以创建噪声图像，反向过程是Swin-Vnet去噪被输入MRI对应患者的噪声CT，以产生无噪声CT。通过优化训练的Swin-Vnet，反向扩散过程用于生成与MRI解剖匹配的sCT。

6.Detecting Images Generated by Deep Diffusion Models using their Local Intrinsic Dimensionality

标题：使用局部内在维度检测深度扩散模型生成的图像

内容：本文提出使用最初为检测对抗样本而开发的轻量级多局部内在维度(multiLID)来自动检测合成图像和识别对应的生成器网络。与许多只能检测GAN生成的图像的现有检测方法不同，该方法在许多实际使用场景中可以实现接近完美的检测结果。大量实验在已知和新创建的数据集上表明，所提出的multiLID方法在扩散检测和模型识别方面展现出优越性。

7.DiffFlow: A Unified SDE Framework for Score-Based Diffusion Models and Generative Adversarial Networks

标题：DiffFlow: 统一的SDE框架,适用于基于得分的扩散模型和对抗生成网络

内容：本文提出了一个统一的理论框架来描述SDMs和GANs。表明：SDMs和GANs的学习动力学可以用一种新提出的名为歧视器去噪扩散流(DiffFlow)的SDE来描述；通过调整不同分数术语之间的相对权重，可以获得SDMs和GANs之间的平滑过渡，而SDE的边缘分布保持不变；作者证明了DiffFlow动力学的渐近最优性和最大似然训练方案；在统一理论框架下，作者提出了几个 DiffFlow的具体实现，它们提供了精确似然推理和在高样本质量与快速采样速度之间进行平衡的新算法。本文为GANs和SDMs提供了一个统一的理论框架，并基于此提出新的生成模型算法。

8.Training Energy-Based Models with Diffusion Contrastive Divergences

标题：使用扩散对比散度训练能量基模型

内容：本文将CD解释为我们提出的扩散对比散度(DCD)家族的一个特例。通过用其他不依赖EBM参数的扩散过程替换CD中使用的Langevin动力学，作者提出了一种更高效的散度，证明所提出的DCD相较CD既更高效又不受非可忽略梯度项的限制。作者进行了大量实验，包括合成数据建模、高维图像降噪和生成，来展示所提出DCD的优势。在合成数据学习和图像降噪实验中，作者提出的DCD明显优于CD。在图像生成实验中，所提出的DCD能够训练出一个生成Celab-A 32x32数据集的能量基模型，与现有EBM可比。

9.DragonDiffusion: Enabling Drag-style Manipulation on Diffusion Models

标题：DragonDiffusion: 在扩散模型上实现拖拽式操作

内容：本文提出了一种新颖的图像编辑方法DragonDiffusion，在扩散模型上实现拖拽式操作。具体来说，通过扩散模型中间特征的强对应关系构建分类器指导。它可以通过特征对应损失将编辑信号转换为渐变，以修改扩散模型的中间表示。在此指导策略的基础上，还构建了多尺度指导，同时考虑语义和几何对齐。此外，添加了跨分支自注意力以维持原始图像和编辑结果之间的一致性。通过高效设计，作者的方法实现了对生成或真实图像的各种编辑模式,如对象移动、调整大小、外观替换和内容拖拽。值得注意的是，所有编辑和内容保留信号都来自图像本身，模型不需要微调或额外模块。

10.Synchronous Image-Label Diffusion Probability Model with Application to Stroke Lesion Segmentation on Non-contrast CT

标题：非对比CT图像脑梗塞灶分割的同步图像标签扩散概率模型

内容：本文提出了一种新颖的同步图像标签扩散概率模型(SDPM)，用于在非对比CT上分割脑梗塞灶，基于马尔可夫扩散过程。作者提出的SDPM完全基于潜变量模型(LVM)，提供了完整的概率推断。引入额外的网状流并行噪声预测流，以高效推断最终标签。通过优化变分边界，训练好的模型可以在输入带噪声图像时推断多个参考标签。在公开和私有三个脑梗塞灶数据集上评估了该模型，与若干U-Net和Transformer基础分割模型相比，作者提出的SDPM模型能够达到最先进的性能。

11.SwinGNN：Rethinking Permutation Invariance in Diffusion Models for Graph Generation

标题：SwinGNN：重新思考图生成扩散模型中的排列不变性

内容：基于排列等变网络的扩散模型可以为图数据学习排列不变的分布，然而与非不变模型相比，这些不变模型的学习面临更大挑战，因为它们的有效目标分布展现更多模态，最优一步去噪分数是具有更多成分的高斯混合的分数函数。为此，作者提出了一个非不变的扩散模型SwinGNN，它采用高效的边到边2-WL消息传递网络，并利用Swin Transformers启发的移位窗口自注意力。此外，通过系统的分析，作者确定了几个关键的训练和采样技术，这显著提高了图生成的样本质量。最后，作者引入了一个简单的后处理技巧，即随机排列生成的图，这可以证明任何图生成模型都可以转换为排列不变的。

其他论文

TomatoDIFF On-plant Tomato Segmentation with Denoising Diffusion Models
Unsupervised Video Anomaly Detection with Diffusion Models Conditioned on Compact Motion Representations
Squeezing Large-Scale Diffusion Models for Mobile
ACDMSR ：Accelerated Conditional Diffusion Models for Single Image Super-Resolution
ON A CHEMOTAXIS-HAPOTAXIS MODEL WITH NONLINEAR DIFFUSION MODELLING MULTIPLE SCLEROSIS
MissDiff：Training Diffusion Models on Tabular Data with Missing Values
Spiking Denoising Diffusion Probabilistic Models
DiffusionSTR：Diffusion Model for Scene Text Recognition
DiffSketcher：Text Guided Vector Sketch Synthesis through Latent Diffusion Models
Diffusion Model Based Low-Light Image Enhancement for Space Satellite
HumanDiffusion：diffusion model using perceptual gradients
EMoG：Synthesizing Emotive Co-speech 3D Gesture with Diffusion Model
Diffusion model based data generation for partial differential equations
Drag-guided diffusion models for vehicle image generation
Diffusion Models for Zero-Shot Open-Vocabulary Segmentation
On the Robustness of Latent Diffusion Models
Diffusion Models for Black-Box Optimization
Fast Diffusion Model
DiffusionShield：A Watermark for Copyright Protection against Generative Diffusion Models
Faster Training of Diffusion Models and Improved Density Estimation via Parallel Score Matching

CVPR 2023

Imagic: Text-Based Real Image Editing with Diffusion Models
DreamBooth: Fine Tuning Text-to-Image Diffusion Models for Subject-Driven Generation
Align your Latents: High-Resolution Video Synthesis with Latent Diffusion Models
On Distillation of Guided Diffusion Models
Seeing Beyond the Brain: Conditional Diffusion Model with Sparse Masked Modeling for Vision Decoding
Diffusion Art or Digital Forgery? Investigating Data Replication in Diffusion Models
Null-text Inversion for Editing Real Images using Guided Diffusion Models
How to Backdoor Diffusion Models
DCFace: Synthetic Face Generation with Dual Condition Diffusion Model
SmartBrush: Text and Shape Guided Object Inpainting with Diffusion Model

ICLR 2023

Diffusion Posterior Sampling for General Noisy Inverse Problems
Diffusion probabilistic modeling of protein backbones in 3D for the motif-scaffolding problem
Diffusion Adversarial Representation Learning for Self-supervised Vessel Segmentation
DreamFusion: Text-to-3D using 2D Diffusion
Diffusion-GAN: Training GANs with Diffusion
Diffusion Policies as an Expressive Policy Class for Offline Reinforcement Learning
Blurring Diffusion Models
Analog Bits: Generating Discrete Data using Diffusion Models with Self-Conditioning
Zero-Shot Image Restoration Using Denoising Diffusion Null-Space Model

关注下方《学姐带你玩AI》

回复“DM论文”免费领取论文原文+代码合集

码字不易，欢迎大家点赞评论收藏！

Spring AI 第二讲之 Chat Model API 第八节ZhiPu AI Chat 疼死老夫了人工智能
SpringAI支持知普人工智能的各种人工智能语言模型。您可以与知普人工智能语言模型互动，并基于知普人工智能模型创建多语言对话助手。先决条件您需要与ZhiPuAI创建一个API，以访问ZhiPuAI语言模型。在ZhiPuAI注册页面创建账户，并在APIKeys页面生成令牌。SpringAI项目定义了一个名为spring.ai.zhipuai.api-key的配置属性，你应将其设置为从APIKeys
Spring AI 第二讲之 Chat Model API 第五节HuggingFace Chat
HuggingFaceInferenceEndpoints允许您在云中部署和提供机器学习模型，并通过API对其进行访问。开始使用有关HuggingFaceInferenceEndpoints的更多详细信息，请访问此处。前提条件添加spring-ai-huggingface依赖关系：org.springframework.aispring-ai-huggingface获取HuggingFaceAPI
动手实践OpenHands系列学习笔记3：LLM集成基础 JeffWoodNo.1 笔记人工智能
笔记3：LLM集成基础一、引言大型语言模型(LLM)是OpenHands代理系统的核心驱动力。本笔记将深入探讨LLMAPI调用的基本原理，以及如何在实践中实现与Claude等先进模型的基础连接模块，为构建AI代理系统奠定基础。二、LLMAPI调用基础知识2.1LLMAPI基本概念API密钥认证:访问LLM服务的身份凭证提示工程:构造有效请求以获取预期响应推理参数:控制模型输出的各种参数流式响应:增
Redis 的特性、工作机制与性能优化全解（含搭建实战教程）
文章目录二、Redis的核心特性三、Redis的工作机制解析单线程模型（性能为何强大？）数据结构是性能的关键持久化机制（数据如何存下来？）四、Redis性能优化实战1.优化内存使用2.提升并发性能3.使用分片/集群机制4.异步处理五、Redis搭建流程（Linux环境）1.下载与解压2.编译并安装3.修改配置文件（推荐复制一份）4.启动Redis5.客户端连接测试六、Redis运维技巧与监控命令七
Chat Model API 虾条_花吹雪 Spring AI java
聊天模型API为开发人员提供了将人工智能聊天完成功能集成到应用程序中的能力。它利用预训练的语言模型，如GPT（生成预训练转换器），以自然语言对用户输入生成类似人类的响应。API通常通过向人工智能模型发送提示或部分对话来工作，然后人工智能模型根据其训练数据和对自然语言模式的理解生成对话的完成或继续。然后将完成的响应返回给应用程序，应用程序可以将其呈现给用户或用于进一步处理。Spring人工智能聊天模
Python 库包 sentence-transformers 音程机器学习人工智能 python 开发语言
sentence-transformers是一个非常流行的Python库，专门用于将文本（句子、段落、文档）转换为高质量的语义向量（嵌入）。它基于Transformer架构（如BERT、RoBERTa、DistilBERT等）的预训练模型，并在大量语义相似性数据上进行了微调，能够捕捉句子之间的深层语义关系。什么是sentence-transformers？项目地址：https://www.sber
创客匠人深度剖析：家庭教育赛道创始人 IP 打造与知识变现的破局之道创小匠 tcp/ip 网络协议网络
在知识付费领域，家庭教育赛道的竞争日益激烈，如何从0-1打造创始人IP并实现高效拓客，成为创业者的核心难题。创客匠人服务的慈航德教育创始人陈向杰老师，通过视频号运营、产品矩阵设计与社群生态构建，实现单月拓客1.6万+，其背后的IP打造逻辑为行业提供了可复用的方法论。从慈航德教育的案例来看，创始人IP的定位需要锚定赛道本质需求。陈向杰老师将“慈、航、德”的品牌理念融入IP人设，以“帮助孩子减负”的教
创客匠人视角下：创始人 IP 如何通过内容运营实现知识变现的冷启动创小匠 tcp/ip 内容运营网络协议
知识付费创业的冷启动阶段，如何快速建立IP影响力并实现用户积累，是创业者面临的首要挑战。创客匠人服务的慈航德教育从0-1入局家庭教育赛道，单月拓客1.6万+的实践，揭示了创始人IP通过内容运营驱动知识变现的底层逻辑。视频号作为IP冷启动的核心阵地，其运营本质是价值观的持续输出。陈向杰老师通过840期连续直播（日均2小时），将“慈祥之心+明确方向+立德树人”的IP理念拆解为具体的育儿干货、案例解析与
创客匠人视角下：创始人 IP 打造与知识变现的深度耦合路径创小匠 tcp/ip 大数据人工智能
在知识经济蓬勃发展的当下，创始人IP打造与知识变现的融合已成为行业破局关键。创客匠人作为深耕知识付费赛道多年的服务平台，其创始人老蒋提出的“土壤构建能力”理论，为理解这一融合逻辑提供了独特视角。从本质来看，创始人IP并非简单的个人品牌包装，而是企业价值观与专业能力的人格化投射。以创客匠人服务的众多知识创业者为例，成功的创始人IP往往具备三大特征：专业领域的深度沉淀、用户需求的精准洞察，以及价值输出
【论文笔记】RAGLAB: A Modular and Research-Oriented Unified Framework for Retrieval-Augmented Generation AustinCyy 论文笔记论文阅读
论文信息论文标题：RAGLAB:AModularandResearch-OrientedUnifiedFrameworkforRetrieval-AugmentedGeneration-EMNLP24论文作者：XuanwangZhang-NanjingUniversity论文链接：https://arxiv.org/abs/2408.11381代码链接：https://github.com/fat
SIMULINK开发项目实例 1000 例专栏之第663例：基于simulink的SVPWM技术的研究的三相电压源逆变器建模仿真 xiaoheshang_123 MATLAB 开发项目实例 1000 例专栏手把手教你学 MATLAB 专栏 matlab simulink
目录准备工作步骤详解第一步：创建Simulink项目第二步：选择并添加合适的库组件第三步：构建基本的三相电压源逆变器模型第四步：实现SVPWM算法第五步：仿真与调试第六步：结果分析第七步：优化与改进第八步：导出与部署总结三相电压源逆变器（VoltageSourceInverter,VSI）在电力电子中是将直流电转换为交流电的一种重要设备，广泛应用于电机驱动、不间断电源（UPS）、可再生能源系统等领
Spring Boot Starter深度解析：从入门到自定义，一篇搞定！码不停蹄的玄黓 spring boot 后端 java starter
引言SpringBootStarter是SpringBoot生态中简化依赖管理和自动配置的核心机制，旨在帮助开发者快速集成常用功能，避免手动配置大量依赖和样板代码。以下从核心概念、工作原理、分类、自定义开发到最佳实践，全面解析SpringBootStarter。一、Starter到底是啥？为啥它是SpringBoot的“开发神器”？1.1一句话定义：依赖的“全家桶”+自动的“配置管家”Starte
【推荐算法课程二】推荐算法介绍-深度学习算法盒子6910 运维视角下的广告业务算法推荐算法深度学习运维开发运维人工智能
三、深度学习在推荐系统中的应用3.1深度学习推荐模型的演化关系图3.2AutoRec——单隐层神经网络推荐模型3.2.1AutoRec模型的基本原理AutoRec模型是一个标准的自编码器，它的基本原理是利用协同过滤中的共现矩阵，完成物品向量或者用户向量的自编码。再利用自编码的结果得到用户对物品的预估评分，进而进行推荐排序。什么是自编码器？自编码器是指能够完成数据“自编码”的模型。无论是图像、音频，
DeepFM算法原理及应用场景
DeepFM（DeepFactorizationMachine）是一种结合了因子分解机（FactorizationMachines,FM）和深度神经网络（DNN）的混合模型，主要用于处理高维稀疏数据（如推荐系统中的点击率预测）。其核心思想是同时捕捉低阶（线性）和高阶（非线性）特征交互。1.算法原理模型结构如下：FM部分：负责捕捉低阶特征交互（如一阶和二阶特征组合）。一阶项：线性特征权重。二阶项：通
Linux内核IPv4路由子系统深度剖析：FIB前端实现与设计原理 109702008 编程 #C语言网络 linux 网络人工智能
深入理解Linux网络栈的核心组件：路由表管理、地址验证与事件处理机制引言在Linux网络栈中，IPv4转发信息库（FIB）是决定数据包传输路径的核心子系统。fib_frontend.c作为FIB的前端实现，承担着路由表管理、用户接口交互和网络事件响应等关键任务。本文将深入剖析这一关键文件的实现原理，揭示Linux路由机制的设计哲学。一、FIB前端整体架构/*核心数据结构*/structfib_t
巅峰对决，超三十万奖金等你挑战！第十届信也科技杯全球AI算法大赛火热开赛！中杯可乐多加冰前沿资讯分享科技人工智能算法计算机视觉机器学习深度学习
信也科技今年跟IJCAI和CIKM这两大全球顶级AI会议合作，这场比赛被全球人工智能顶会CIKM收录为官方赛事单元，获奖选手有机会全球人工智能顶会创造更大的影响力。一、赛事概况随着深度伪造技术的高度发展，人工智能产业走深向实，生成合成技术开始呈现工具化和普及化趋势。在生成合成内容质量显著提升的当下，基于换脸攻击的身份冒用和欺诈事件在全球范围内激增，严重威胁个人隐私和公共数据安全。第十届信也科技杯全
大模型 AI智能体Coze知识库从使用到实战详解非著名架构师大模型知识文档人工智能 Coze知识库
一、Coze知识库核心价值解析1.1知识库技术架构创新Coze知识库采用四层混合架构设计，在2025年大模型应用中展现出独特优势：存储层：支持向量数据库（Qdrant）+图数据库（Neo4j）双引擎处理层：集成PDF/PPT/Excel等23种文件解析器检索层：混合检索算法（BM25+稠密检索+语义路由）应用层：RAG（检索增强生成）优化接口与传统方案相比，查询准确率提升42%，特别擅长处理：专业
DeepSeek-R1满血版:硅基流动API或本地部署 Mikhail_G AIGC 语言模型数据分析大数据 python
大家好!想在手机上部署DeepSeek-R1满血版（671B）？我来手把手教你最靠谱的两种方式！满血版模型参数高达671亿，手机本地运行几乎不可能，但通过「云服务+手机App」的组合，你一样能在手机上丝滑使用真正的满血版DeepSeek-R1！一、推荐方案：通过SiliconFlow+Chatbox使用满血版（iOS/安卓均支持）这是目前最稳定、免费额度高、操作简单的方式，适合所有用户。原理：用S
【AI智能推荐系统】第二篇：深度学习在推荐系统中的架构设计与优化实践 DeepFaye 人工智能深度学习
第二篇：深度学习在推荐系统中的架构设计与优化实践提示语：“从Wide&Deep到Transformer，深度推荐模型如何突破性能瓶颈？本文将揭秘Netflix、淘宝都在用的深度学习推荐架构，手把手教你设计高精度推荐系统！”目录深度学习推荐系统的核心优势主流深度学习推荐架构解析2.1Wide&Deep模型2.2DeepFM与xDeepFM2.3神经协同过滤(NCF)2.4基于Transformer的
Python Scrapy的爬虫中间件开发 AI天才研究院 python scrapy 爬虫 ai
PythonScrapy爬虫中间件开发：从原理到实战的深度解析关键词Scrapy中间件、爬虫扩展、请求响应处理、反爬绕过、中间件生命周期、钩子函数、分布式爬取摘要本文系统解析Scrapy爬虫中间件（SpiderMiddleware）的开发方法论，覆盖从基础概念到高级实践的全链路知识。通过第一性原理推导中间件的核心机制，结合层次化架构分析（理论→设计→实现→应用），提供生产级代码示例与可视化流程模型
Node.js worker_threads：并发 vs 并行红衣大叔 nodejs帮助文档 node.js
一、核心结论Node.js的worker_threads模块实现的是并行计算，而非传统意义上的“并发”。其通过操作系统级线程实现多核CPU的并行执行，同时保留Node.js单线程事件循环的并发模型。二、关键概念解析1.并发（Concurrency）vs并行（Parallelism）并发：指系统同时处理多个任务的能力，但任务可能交替执行（如单核CPU通过时间片轮转）。Node.js主线程的事件循环是
【C#】MVVM基础知识及基本应用 Mike_Wuzy c#
以下是一些关于C#中MVVM（Model-View-ViewModel）模式的基础知识：1.模型(Model)模型负责表示数据和业务逻辑，通常包括数据库访问、文件操作等。它不包含任何用户界面相关的代码。publicclassPerson{publicintId{get;set;}publicstringName{get;set;}publicDateTimeBirthDate{get;set;}/
Assistant API 流式传输中的事件流原理细节上有晨光大模型Agent开发人工智能算法大模型 OpenAI Agent
一、AssistantAPI流式传输事件流基础OpenAIAssistantAPI的流式输出在特定操作时会生成新事件，每个事件由event和data构成。data存放如大模型回复等关键数据，event则表明大模型的处理阶段，像运行、排队、完成等状态信息。二、事件流核心流程整体流程：从创建assistant对象、thread对象并追加message开启run状态（即start模式）起，到获取模型回复
Assistant API 进阶应用方法介绍上有晨光大模型Agent开发人工智能算法大模型 Agent OpenAI
一、课程回顾之前博客内容围绕OpenAIAssistantAPI展开，详细讲解了其基本原理、构建对话或代理的完整生命周期，以及Assistant、Thread、Message和Run这四个抽象概念之间的关系。在此基础上，搭建了用户与大模型对话的基础通路，不过这只是该API最基础的应用形式。二、AssistantAPI概述（一）优势与特点AssistantAPI在性能和易用性方面表现卓越，超越了市面
雪球结构定价与风险深度分析 wh3933
一、雪球结构简介雪球（Snowball）结构属于路径依赖型奇异衍生品，其结构相对复杂，但自2019年开始，雪球这种非保本型收益凭证受到市场上越来越多的关注，各类金融机构纷纷以不同角色参与其中，雪球在市场中的影响也逐渐增强。雪球型收益凭证实际是卖出了敲入结构的看跌期权，只要标的不发生大幅下跌，持有该收益凭证的时间越长，获得票息收益越多，类似于滚雪球一样，只要地面不出现非常大的坑洼，雪球就会越滚越大。
OPENAI中Assistants API的实现原理及示例代码python实现 dzend aigc python ai
OPENAI中AssistantsAPI的实现原理及示例代码前言OPENAI是一家人工智能公司，致力于研究和开发人工智能技术。其中，AssistantsAPI是OPENAI推出的一项人工智能服务，可以帮助开发者快速构建智能助手。本文将介绍AssistantsAPI的实现原理，并提供使用Python实现的示例代码。AssistantsAPI实现原理AssistantsAPI的实现原理主要包括以下几个
Java+Python智能化云盘【Day3】关沐吖 Java+Python Ai智能云盘项目开发专栏 java python 开发语言
提示词工程Prompt简介：大模型必备Prompt提示词工程讲解什么是PromptEngineering提示词工程通过特定格式的文本输入引导AI模型生成期望输出的技术，明确地告诉模型你想要解决的问题或完成的任务也是大语言模型理解用户需求并生成相关、准确回答或内容的基础类比：给Java程序员的任务需求文档（越清晰明确，结果越符合预期）为什么需要学习？大模型就是你的员工，你可以有多个助手，OpenAI
2025年6月AIGC发展全景：技术轻量化、Agent产业化与伦理新挑战 Loving_enjoy 计算机学科论文创新点深度学习人工智能经验分享 facebook
>**当一块消费级GPU能解高考数学题，当AI智能体接管医院诊断流程，我们正站在人机协作新纪元的门槛上**2025年6月，AIGC领域迎来关键转折点——**模型轻量化**让百亿参数算法飞入寻常设备，**多模态融合**打破文本与视觉的次元壁，而**Agent智能体**正从实验室概念蜕变为产业核心引擎。这场变革不仅重塑技术范式，更在重构商业逻辑与人类创造力边界。---###一、技术突破：垂直化、轻量化
【超分辨率（Super-Resolution）】关于【超分辨率重建】专栏的相关说明，包含专栏简介、专栏亮点、适配人群、相关说明、阅读顺序、超分理解、实现流程、研究方向、论文代码数据集汇总等十小大超分辨率重建（理论+实战科研+应用）超分辨率重建人工智能图像处理深度学习计算机视觉图像超分 pytorch
文章目录专栏简介专栏亮点适配人群相关说明关于答疑环境配置超分理解实现流程文章目录基础知识三个常用的SR框架数据集相关可解释性（论文中的可视化说明）图像超分（ImageSuper-Resolution）经典超分（ClassicalSR）任意尺度超分（Arbitrary-ScaleSR）高效/轻量化超分（Efficient/LightweightSR，ESR）盲超分/真实世界图像超分辨率（Blind/
【图像超分】论文复现：密集残差链接Transformer！DRCT的Pytorch源码复现，跑通超分源码，获得指标、模型复杂度、结果可视化，核心模块拆解与源码对应，注释详细！十小大超分辨率重建（理论+实战科研+应用）pytorch 深度学习超分辨率重建图像处理计算机视觉 python transformer
请先看【专栏介绍文章】：【超分辨率（Super-Resolution）】关于【超分辨率重建】专栏的相关说明，包含专栏简介、专栏亮点、适配人群、相关说明、阅读顺序、超分理解、实现流程、研究方向、论文代码数据集汇总等）完整代码和训练好的模型权重文件下载链接见本文底部，订阅专栏免费获取！本文亮点：跑通DRCT源码，获得与论文一致的PSNR/SSIM、Params、超分可视化结果，修正论文中FLOPs的计
apache ftpserver-CentOS config gengzg apache
<server xmlns="http://mina.apache.org/ftpserver/spring/v1" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation=" http://mina.apache.o
优化MySQL数据库性能的八种方法 AILIKES sql mysql
1、选取最适用的字段属性　　MySQL可以很好的支持大数据量的存取，但是一般说来，数据库中的表越小，在它上面执行的查询也就会越快。因此，在创建表的时候，为了获得更好的性能，我们可以将表中字段的宽度设得尽可能小。例如，在定义邮政编码这个字段时，如果将其设置为CHAR(255),显然给数据库增加了不必要的空间，甚至使用VARCHAR这种类型也是多余的，因为CHAR(6)就可以很
JeeSite 企业信息化快速开发平台 Kai_Ge JeeSite
JeeSite 企业信息化快速开发平台平台简介 JeeSite是基于多个优秀的开源项目，高度整合封装而成的高效，高性能，强安全性的开源Java EE快速开发平台。 JeeSite本身是以Spring Framework为核心容器，Spring MVC为模型视图控制器，MyBatis为数据访问层， Apache Shiro为权限授权层，Ehcahe对常用数据进行缓存，Activit为工作流
通过Spring Mail Api发送邮件 120153216 邮件 main
原文地址：http://www.open-open.com/lib/view/open1346857871615.html 使用Java Mail API来发送邮件也很容易实现，但是最近公司一个同事封装的邮件API实在让我无法接受，于是便打算改用Spring Mail API来发送邮件，顺便记录下这篇文章。【Spring Mail API】 Spring Mail API都在org.spri
Pysvn 程序员使用指南 2002wmj SVN
源文件:http://ju.outofmemory.cn/entry/35762 这是一篇关于pysvn模块的指南. 完整和详细的API请参考 http://pysvn.tigris.org/docs/pysvn_prog_ref.html. pysvn是操作Subversion版本控制的Python接口模块. 这个API接口可以管理一个工作副本, 查询档案库, 和同步两个. 该
在SQLSERVER中查找被阻塞和正在被阻塞的SQL 357029540 SQL Server
SELECT R.session_id AS BlockedSessionID , S.session_id AS BlockingSessionID , Q1.text AS Block
Intent 常用的用法备忘 7454103 .net android Google Blog F#
Intent 应该算是Android中特有的东西。你可以在Intent中指定程序要执行的动作（比如：view,edit,dial），以及程序执行到该动作时所需要的资料。都指定好后，只要调用startActivity()，Android系统会自动寻找最符合你指定要求的应用程序，并执行该程序。下面列出几种Intent 的用法显示网页:
Spring定时器时间配置 adminjun spring 时间配置定时器
红圈中的值由6个数字组成，中间用空格分隔。第一个数字表示定时任务执行时间的秒，第二个数字表示分钟，第三个数字表示小时，后面三个数字表示日，月，年，< xmlnamespace prefix ="o" ns ="urn:schemas-microsoft-com:office:office" /> 测试的时候，由于是每天定时执行，所以后面三个数
POJ 2421 Constructing Roads 最小生成树 aijuans 最小生成树
来源：http://poj.org/problem?id=2421 题意：还是给你n个点，然后求最小生成树。特殊之处在于有一些点之间已经连上了边。思路：对于已经有边的点，特殊标记一下，加边的时候把这些边的权值赋值为0即可。这样就可以既保证这些边一定存在，又保证了所求的结果正确。代码： #include <iostream> #include <cstdio>
重构笔记——提取方法（Extract Method） ayaoxinchao java 重构提炼函数局部变量提取方法
提取方法（Extract Method）是最常用的重构手法之一。当看到一个方法过长或者方法很难让人理解其意图的时候，这时候就可以用提取方法这种重构手法。下面是我学习这个重构手法的笔记：提取方法看起来好像仅仅是将被提取方法中的一段代码，放到目标方法中。其实，当方法足够复杂的时候，提取方法也会变得复杂。当然，如果提取方法这种重构手法无法进行时，就可能需要选择其他
为UILabel添加点击事件 bewithme UILabel
默认情况下UILabel是不支持点击事件的，网上查了查居然没有一个是完整的答案，现在我提供一个完整的代码。 UILabel *l = [[UILabel alloc] initWithFrame:CGRectMake(60, 0, listV.frame.size.width - 60, listV.frame.size.height)]
NoSQL数据库之Redis数据库管理(PHP-REDIS实例) bijian1013 redis 数据库 NoSQL
一.redis.php <?php //实例化 $redis = new Redis(); //连接服务器 $redis->connect("localhost"); //授权 $redis->auth("lamplijie"); //相关操
SecureCRT使用备注 bingyingao secureCRT 每页行数
SecureCRT日志和卷屏行数设置一、使用securecrt时，设置自动日志记录功能。 1、在C:\Program Files\SecureCRT\下新建一个文件夹(也就是你的CRT可执行文件的路径），命名为Logs； 2、点击Options -> Global Options -> Default Session -> Edite Default Sett
【Scala九】Scala核心三：泛型 bit1129 scala
泛型类 package spark.examples.scala.generics class GenericClass[K, V](val k: K, val v: V) { def print() { println(k + "," + v) } } object GenericClass { def main(args: Arr
素数与音乐 bookjovi 素数数学 haskell
由于一直在看haskell，不可避免的接触到了很多数学知识，其中数论最多，如素数，斐波那契数列等，很多在学生时代无法理解的数学现在似乎也能领悟到那么一点。闲暇之余，从图书馆找了<<The music of primes>>和<<世界数学通史>>读了几遍。其中素数的音乐这本书与软件界熟知的&l
Java-Collections Framework学习与总结-IdentityHashMap BrokenDreams Collections
这篇总结一下java.util.IdentityHashMap。从类名上可以猜到，这个类本质应该还是一个散列表，只是前面有Identity修饰，是一种特殊的HashMap。简单的说，IdentityHashMap和HashM
读《研磨设计模式》-代码笔记-享元模式-Flyweight bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.Collection; import java.util.HashMap; import java.util.List; import java
PS人像润饰&调色教程集锦 cherishLC PS
1、仿制图章沿轮廓润饰——柔化图像，凸显轮廓 http://www.howzhi.com/course/retouching/ 新建一个透明图层，使用仿制图章不断Alt+鼠标左键选点，设置透明度为21%，大小为修饰区域的1/3左右（比如胳膊宽度的1/3），再沿纹理方向（比如胳膊方向）进行修饰。所有修饰完成后，对该润饰图层添加噪声，噪声大小应该和
更新多个字段的UPDATE语句 crabdave update
更新多个字段的UPDATE语句 update tableA a set (a.v1, a.v2, a.v3, a.v4) = --使用括号确定更新的字段范围
hive实例讲解实现in和not in子句 daizj hive not in in
本文转自：http://www.cnblogs.com/ggjucheng/archive/2013/01/03/2842855.html 当前hive不支持 in或not in 中包含查询子句的语法，所以只能通过left join实现。假设有一个登陆表login(当天登陆记录,只有一个uid),和一个用户注册表regusers(当天注册用户，字段只有一个uid)，这两个表都包含
一道24点的10+种非人类解法（2,3,10,10） dsjt 算法
这是人类算24点的方法？！！！事件缘由：今天晚上突然看到一条24点状态，当时惊为天人，这NM叫人啊？以下是那条状态朱明西 : 24点，算2 3 10 10，我LX炮狗等面对四张牌痛不欲生，结果跑跑同学扫了一眼说，算出来了，2的10次方减10的3次方。。我草这是人类的算24点啊。。然后么。。。我就在深夜很得瑟的问室友求室友算刚出完题，文哥的暴走之旅开始了 5秒后
关于YII的菜单插件 CMenu和面包末breadcrumbs路径管理插件的一些使用问题 dcj3sjt126com yii framework
在使用 YIi的路径管理工具时，发现了一个问题。 <?php
对象与关系之间的矛盾：“阻抗失配”效应[转] come_for_dream 对象
概述 “阻抗失配”这一词组通常用来描述面向对象应用向传统的关系数据库（RDBMS）存放数据时所遇到的数据表述不一致问题。C++程序员已经被这个问题困扰了好多年，而现在的Java程序员和其它面向对象开发人员也对这个问题深感头痛。 “阻抗失配”产生的原因是因为对象模型与关系模型之间缺乏固有的亲合力。“阻抗失配”所带来的问题包括：类的层次关系必须绑定为关系模式（将对象
学习编程那点事 gcq511120594 编程互联网
一年前的夏天，我还在纠结要不要改行，要不要去学php？能学到真本事吗？改行能成功吗？太多的问题，我终于不顾一切，下定决心，辞去了工作，来到传说中的帝都。老师给的乘车方式还算有效，很顺利的就到了学校，赶巧了，正好学校搬到了新校区。先安顿了下来，过了个轻松的周末，第一次到帝都，逛逛吧！接下来的周一，是我噩梦的开始，学习内容对我这个零基础的人来说，除了勉强完成老师布置的作业外，我已经没有时间和精力去
Reverse Linked List II hcx2013 list
Reverse a linked list from position m to n. Do it in-place and in one-pass. For example:Given 1->2->3->4->5->NULL, m = 2 and n = 4, return
Spring4.1新特性——页面自动化测试框架Spring MVC Test HtmlUnit简介 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
Hadoop集群工具distcp liyonghui160com
1. 环境描述两个集群：rock 和 stone rock无kerberos权限认证，stone有要求认证。 1. 从rock复制到stone，采用hdfs Hadoop distcp -i hdfs://rock-nn:8020/user/cxz/input hdfs://stone-nn:8020/user/cxz/运行在rock端，即源端问题：报版本
一个备份MySQL数据库的简单Shell脚本 pda158 mysql 脚本
　　主脚本（用于备份mysql数据库）：　　该Shell脚本可以自动备份数据库。只要复制粘贴本脚本到文本编辑器中，输入数据库用户名、密码以及数据库名即可。我备份数据库使用的是mysqlump 命令。后面会对每行脚本命令进行说明。　　 1. 分别建立目录“backup”和“oldbackup” 　　#mkdir /backup 　　#mkdir /oldbackup 　
300个涵盖IT各方面的免费资源（中）——设计与编码篇 shoothao IT资源图标库图片库色彩板字体
A. 免费的设计资源 Freebbble:来自于Dribbble的免费的高质量作品。 Dribbble:Dribbble上“免费”的搜索结果——这是巨大的宝藏。 Graphic Burger:每个像素点都做得很细的绝佳的设计资源。 Pixel Buddha:免费和优质资源的专业社区。 Premium Pixels:为那些有创意的人提供免费的素材。
thrift总结 - 跨语言服务开发 uule thrift
官网官网JAVA例子 thrift入门介绍 IBM-Apache Thrift - 可伸缩的跨语言服务开发框架 Thrift入门及Java实例演示 thrift的使用介绍 RPC POM： <dependency> <groupId>org.apache.thrift</groupId>

2023扩散模型最新技术进展汇总

1.Hyperspectral and Multispectral Image Fusion Using the Conditional Denoising Diffusion Probabilistic Model

​2.IPO-LDM Depth-aided 360-degree Indoor RGB Panorama Outpainting via Latent Diffusion Model

​3.How to Detect Unauthorized Data Usages in Text-to-image Diffusion Models

​4.Censored Sampling of Diffusion Models Using 3 Minutes of Human Feedback

​5.Synthetic CT Generation from MRI using 3D Transformer-based Denoising Diffusion Model

​6.Detecting Images Generated by Deep Diffusion Models using their Local Intrinsic Dimensionality

​7.DiffFlow: A Unified SDE Framework for Score-Based Diffusion Models and Generative Adversarial Networks