kebijuelun

Stable Diffusion - High-Resolution Image Synthesis with Latent Diffusion Models

Paper name

High-Resolution Image Synthesis with Latent Diffusion Models

Paper Reading Note

Paper URL: https://arxiv.org/abs/2112.10752

Code URL: https://github.com/CompVis/latent-diffusion

TL;DR

2021 年 runway 和慕尼黑路德维希·马克西米利安大学出品的文章，开源社区大名顶顶的文生图模型 stable diffusion 背后的论文。提出 Latent Diffusion Models，基于 latent space 进行 diffusion，降低计算量需求。

Introduction

背景

图像生成对计算需求较大，当前一些主流方法的优缺点对比：
- 自回归（AR）transformer：对于复杂、自然场景的高分辨率图像合成，目前主要是通过（scaling up likelihood-based）概率模型扩展来实现的，这些模型可能包含数十亿参数，参数量较大
- GAN 的结果主要局限于有限变异性的数据，对抗学习过程不容易扩展到建模复杂、多模态分布
- Diffusion 模型由一系列去噪自动编码器构成，作为基于似然的模型，没有 GAN 的模式崩溃和训练不稳定性，并且通过参数共享，可以模拟自然图像高度复杂分布，无需像 AR 模型那样涉及数十亿参数
Diffusion 模型现有问题：
- 训练和评估模型需要在 RGB 图像这样的高维空间中进行重复的函数评估（和梯度计算），例如，训练最强大的 Diffusion 模型通常需要数百个 GPU 天（例如，在论文 Diffusion Models Beat GANs on Image Synthesis 中为150-1000 个 V100 天）。在输入空间的噪声版本上进行重复评估也使推理变得昂贵，因此在单个A100 GPU上生成50k样本大约需要5天

本文方案

提出 Latent Diffusion Models，基于 latent space 进行 diffusion，降低计算量需求
出发点来源于对训练好的像素空间 diffusion 模型进行分析：下图展示了一个训练好的模型的速率-失真关系。学习大致可以分为两个阶段：首先是感知压缩阶段，该阶段去除了高频细节，但仍然学到了很少的语义变化。在第二阶段，实际的生成模型学习数据的语义和概念组成（语义压缩）。本文的目标是首先找到一个在感知上等效但在计算上更合适的空间，在这个空间中我们将训练高分辨率图像合成的扩散模型。
本文模型在细节上和指标上优于同时期的 AR 或者 GAN 模型。基于更少的下采样比率实现了更高的效率

Methods

为了降低训练扩散模型以实现高分辨率图像合成的计算需求，我们观察到，虽然扩散模型通过对应的损失项进行欠采样，允许忽略感知上不相关的细节，但它们仍然需要在像素空间进行昂贵的函数评估，这导致计算时间和能源资源的巨大需求。我们提出通过引入压缩学习和生成学习阶段的显式分离（见图2）来规避这一缺点。为了实现这一点，我们利用一个自动编码模型，该模型学习了一个在感知上等效于图像空间的空间，但具有显著降低的计算复杂性。

Perceptual Image Compression

主要基于之前的工作进行，由一个自编码器组成，通过 perceptual loss 和 patch-based 对抗损失进行训练。这确保了通过强制局部真实性，重建被限制在图像流形上，并避免了仅依赖于像素空间损失（如L2或L1目标）引入的模糊性。
具体来说
- 给定一张图片 $\in \mathbb{R}^{H \times W \times 3}$
- encoder $\varepsilon$ 用于将 x 编码到 latent 空间表示： $\varepsilon(x)$
- decoder $D$ 用于将 latent 空间重建为图片： $\widetilde{x}= D(z)$
- encoder 下采样率表示为： $f = H/h = W/w= 2^{m}$
为了避免潜在空间的任意高方差，尝试了两种不同的正则化方法。
- 第一种变体 KL-reg.，对学到的 latent 施加了轻微的KL惩罚，朝向标准正态，类似于VAE
- 第二种变体 VQ-reg. 则在解码器内使用了一个向量量化层。这个模型可以解释为是一个VQGAN，但量化层被吸收到解码器中。
- 由于我们后续的扩散模型（DM）被设计为使用我们学到的潜在空间 z = E(x) 的二维结构，我们可以使用相对不过度的压缩率并实现非常好的重建。这与先前的工作 VQGAN/DALL-E 形成对比，其依赖于学到的空间 z 的任意 1D 排序来自回归地建模其分布，从而忽略了 z 的许多固有结构。因此，我们的压缩模型更好地保留了 x 的细节（见下表）。

Latent Diffusion Models

扩散模型(DM):

DM 设计用于通过逐渐去噪一个正态分布变量来学习数据分布 p(x) 的概率模型，这对应于学习长度为 T 的固定马尔可夫链的反向过程。在图像合成方面，最成功的模型 DDPM 等基于对 p(x) 变分下界的一种重新加权变体，这反映了去噪得分匹配。这些模型可以解释为一个等权重的去噪自动编码器序列 $\epsilon(x_{t}, t); t = 1 . . . T$ ，这些自动编码器经过训练以预测其输入 xt 的去噪变体，其中 xt 是输入 x 的带噪声版本。相应的目标可以简化为：
$\mathcal{L}_{\text{DM}} = \mathbb{E}_{x, \epsilon \sim \mathcal{N}(0,1),t}[\| \epsilon - \epsilon_{\theta}(x_t, t) \|_2^2]$
其中 t 均匀采样自 {1, . . . , T}。

潜在表示的生成建模(Generative Modeling of Latent Representations)

利用我们训练得到的感知压缩模型，其中包括 $\varepsilon$ 和 $D$ ，我们现在可以访问一个高效、低维的潜在空间，其中高频、难以察觉的细节被抽象化了。与高维像素空间相比，这个空间更适合基于似然的生成模型，因为它们现在可以
- （i）专注于数据的重要、语义
- （ii）在一个更低维、计算效率更高的空间中进行训练。
训练目标表示为
$\mathcal{L}_{\text{LDM}} := \mathbb{E}_{E(x), \epsilon \sim \mathcal{N}(0,1),t}[\| \epsilon - \epsilon_{\theta}(z_t, t) \|_2^2].$
我们模型的神经骨架 $\epsilon (◦, t)$ 实现为一个时态条件(time-conditional) UNet。由于正向过程是固定的，在训练过程中可以有效地从 $\varepsilon$ 获取 $z_t$ ，并且从 $p (z)$ 中解码的样本可以通过一次 $D$ 的传递转换回图像空间。

Conditioning Mechanisms

类似于其他类型的生成模型 (CGAN)，扩散模型原则上能够建模形式为 $p (z ∣ y)$ 的条件分布。这可以通过使用条件去噪自动编码器 $\epsilon (z_t, t, y)$ 来实现，并为通过输入 y（如文本、语义地图或其他图像到图像翻译任务）控制合成。然而，在图像合成的背景下，将 DMs 的生成能力与超出类别标签或输入图像的模糊变体之外的其他类型的条件结合起来，迄今为止仍是一个未充分探讨的研究领域。我们通过在 DMs 的基础 UNet 骨干上增加交叉注意力机制将 DMs 转化为更灵活的条件图像生成器。
为了预处理来自各种模态的 y（例如语言提示），我们引入了一个领域特定的编码器 $\tau_{\theta}$ ，将 y 投影到一个中间表示 $\tau_{\theta}(y) ∈ \mathbb{R}^{M \times d_\tau}$ ，然后通过以下的交叉注意力机制实现将 $\tau_{\theta}(y)$ 映射到 UNet 的中间层：
$softmax(\frac{QK^T}{\sqrt{d}})·V$
其中 $W^{(i)}_Q · \varphi_{i}(zt)$ ， $W^{(i)}_K · \tau_{\theta}(y)$ ， $W^{(i)}_V · \tau_{\theta}(y)$ 。在这里， $\varphi_{i}(zt) \in \mathbb{R}^{N \times di}$ 代表 UNet 实现 $\epsilon_\theta$ 的（flattened）中间表示， $W^{(i)}_V \in \mathbb{R}^{d \times d_i}$ ， $W^{(i)}_Q ∈ R^d×dτ$ 和 $W_K^{(i)} \in \mathbb{R}^{d \times d_\tau}$ 是可学习的投影矩阵。见图 3 进行视觉描述。基于图像条件对，然后通过以下方式学习条件 LDM：
$\mathcal{L}_{\text{LDM}} := \mathbb{E}_{\varepsilon(x), y, \epsilon \sim \mathcal{N}(0,1),t}[\| \epsilon - \epsilon_{\theta}(z_t, t, \tau_{\theta}(y)) \|_2^2]$
其中 $\tau_{\theta}$ 和 $\epsilon_{\theta}$ 通过上面的目标函数联合优化。这个条件机制是灵活的，因为 $\tau_{\theta}$ 可以用领域特定的模型进行初始化。

Experiments

首先，我们将分析我们的模型在训练和推断中与基于像素的扩散模型相比的优势。有趣的是，我们发现在 VQ 正则化的潜在空间中训练的 LDMs 有时能够实现更好的样本质量，即使相较于连续版本，VQ 正则化的第一阶段模型的重建能力（reconstruction capabilities）略微落后，参见上述的表 8。
关于第一阶段正则化方案对 LDM 训练的影响以及它们对分辨率 > 256^2 的泛化能力的视觉比较如下

由潜在空间的方差引起的信噪比（即 $Var(z)/\sigma^2_t$ ）对卷积采样的结果有显著影响。例如，当直接在一个KL正则化模型的潜在空间中训练 LDM 时，这个比率非常高，以至于模型在反向去噪过程的早期分配了大量的语义细节。相反，当通过潜在变量的逐分量标准差对潜在空间进行重新缩放时，信噪比降低。我们在上图中说明了这对语义图像合成中卷积采样的影响。请注意，VQ 正则化空间的方差接近1，因此不需要重新缩放。

On Perceptual Compression Tradeoffs

本节分析了我们的LDMs在不同的下采样因子f ∈ {1, 2, 4, 8, 16, 32}（简写为LDM-f，其中LDM-1对应于基于像素的DMs）的行为。为了获得可比较的测试场，我们将计算资源固定为单个NVIDIA A100，并在本节的所有实验中以相同数量的步骤和相同数量的参数对所有模型进行训练。
ImageNet 数据集上进行了 2M 步类别条件模型训练的样本质量随训练进展的变化如下，LDM-{4-16}在效率和感知上忠实的结果之间取得了良好的平衡：
- i) 对于LDM-{1,2}来说，小的下采样因子导致训练进展缓慢。作者认为原因是将大部分感知压缩留给扩散模型
- ii) 过大的 f 值导致在相对较少的训练步骤后保真度停滞。作者认为原因是过强的第一阶段压缩导致信息丢失，从而限制了可实现的质量
比较了在 CelebAHQ 和 ImageNet 上训练的模型，针对 DDIM 采样器的不同去噪步骤数量，将其与FID分数绘制在一起。LDM-{4-8} 在感知和概念压缩的不合适比率方面优于其他模型

Image Generation with Latent Diffusion

在 CelebA-HQ、FFHQ、LSUN-Churches 和 Bedrooms 上训练了 256^2 图像的无条件模型，并评估了它们的 i) 样本质量和 ii) 对数据流形的覆盖，使用 ii) FID 和 ii) 精度与召回指标进行评测。在CelebA-HQ上，我们报告了一个新的FID记录，为5.11，超过了先前基于似然的模型以及GANs
生成效果如下

Conditional Latent Diffusion

实现方式：对于文本到图像建模，我们在 LAION-400M 上训练了一个具有 1.45B 参数的 KL 正则化的 LDM，该模型以语言提示为条件
- 使用BERT-tokenizer，并将 $\tau_\theta$ 实现为一个 transformer，以推断一个潜在特征，该特征通过（多头）交叉注意力映射到 UNet
COCO 上的定量分析结果，classifier-free diffusion guidance 极大提升质量。使用 guide 的 LDM-KL-8-G 基本能基本媲美 AR 方法 Make-A-Scene 和 diffusion 方法 GLIDE
基于文本作为条件
基于检测框和文本作为条件
基于语义分割图作为条件

超分应用

低分辨率图片作为条件训练，即可进行超分操作

inpainting 应用

Thoughts

比较早期的经典工作，实验非常详尽，将 diffusion 开源效果推到新的高度

你可能感兴趣的:(paper_reading,stable,diffusion,人工智能)

AI如何帮助解决生活中的琐碎难题？ HUIBUR科技人工智能
引言：AI已经融入我们的日常生活你有没有遇到过这样的情况——早上匆忙出门却忘了带钥匙，到了公司才想起昨天的会议资料没有打印，或者下班回家还在纠结晚饭吃什么？这些看似微不足道的小事，往往让人疲惫不堪。而如今，人工智能（AI）的出现，正在悄然改变这一切。从语音助手到智能家居，从健康管理到购物推荐，AI正在帮助人们处理生活中的琐碎事务，让每一天变得更高效、更轻松。只需要动动嘴或者点一点手机，就能完成过去
DeepSeek是由杭州深度求索人工智能基础技术研究有限公司（简称“深度求索”）发布的一系列人工智能模型大霸王龙人工智能
DeepSeek是由杭州深度求索人工智能基础技术研究有限公司（简称“深度求索”）发布的一系列人工智能模型，其在知识类任务上展现出了卓越的性能。以下是对DeepSeek的详细介绍，内容虽无法达到10000字，但会尽可能全面且深入地解析其各个方面。一、公司背景与核心理念DeepSeek的母公司深度求索由幻方量化在2023年4月创立。幻方量化是国内量化私募领域的巨头之一，管理规模庞大。DeepSeek的
数据挖掘的常用算法北柠陌寒0207 笔记
在大数据时代,数据挖掘是最关键的工作。大数据的挖掘是从海量、不完全的、有噪声的、模糊的、随机的大型数据库中发现隐含在其中有价值的、潜在有用的信息和知识的过程,也是一种决策支持过程。其主要基于人工智能,机器学习,模式学习,统计学等。通过对大数据高度自动化地分析,做出归纳性的推理,从中挖掘出潜在的模式,可以帮助企业、商家、用户调整市场政策、减少风险、理性面对市场,并做出正确的决策。目前,在很多领域尤其
OpenAI的编程语言和框架，给程序员带来了帮助有哪些 API技术大佬Anzexi58 OpenAI 人工智能人工智能深度学习
OpenAI是一个人工智能开发公司，成立于2015年，总部位于美国旧金山。这家公司致力于研究和开发先进的人工智能技术，旨在将这些技术应用到解决全球一些最棘手的问题上。OpenAI以其卓越的技术和实验室出品的groundbreakingAIpapers而闻名。OpenAI的研究涉及深度学习、自然语言处理、视觉感知、强化学习等多个领域，并已在各种应用中取得了令人瞩目的成果。例如，在机器人领域，Open
LangGraph系列-1：用LangGraph构建简单聊天机器人梦想画家机器学习 LangGraph LangChain
在快速发展的人工智能和大型语言模型（llm）世界中，开发人员不断寻求创建更灵活、更强大、更直观的人工智能代理的方法。虽然LangChain已经改变了这个领域的游戏规则，允许创建复杂的链和代理，但对代理运行时的更复杂控制的需求也在不断增长。LangGraph是建立在LangChain之上的重要模块，它将彻底改变我们设计和实施人工智能工作流的方式。在这篇博客中，我们提供了一个关于构建聊天机器人和彻底改
MyEclipse最新版-版本更新说明及下载 - MyEclipse官方中文网 weixin_34268310 开发工具
http://www.myeclipsecn.com/learningcenter/myeclipse-update/【重要更新】MyEclipse2015正式版发布【重要更新】MyEclipse2015Stable2.0发布【重要更新】MyEclipse2016CI0正式发布【重要更新】MyEclipse2016Stable1.0发布【重要更新】MyEclipse2017CI1正式发布【重要更新
探索OpenAI Python SDK: 智能编程新里程周澄诗Flourishing
探索OpenAIPythonSDK:智能编程新里程openai-pythonTheofficialPythonlibraryfortheOpenAIAPI项目地址:https://gitcode.com/gh_mirrors/op/openai-python如果你对人工智能和自然语言处理有浓厚的兴趣，那么这个项目将为你开启新的探索之门——。这是一个由OpenAI开发的Python库，用于与他们的A
Upgini: 智能数据搜索与丰富化引擎 - 提升机器学习和人工智能模型准确性的利器 2401_87189860 人工智能机器学习
Upgini:智能数据搜索与丰富化引擎在当今数据驱动的世界中,机器学习和人工智能模型的准确性至关重要。然而,提高模型准确性往往是一项艰巨的任务,需要大量的特征工程和数据处理工作。幸运的是,Upgini这一创新的Python库为数据科学家和机器学习工程师提供了一个强大的解决方案。Upgini的核心功能Upgini是一个智能数据搜索和丰富化引擎,专为机器学习和AI设计。它的主要功能包括:自动特征发现与
CopilotForXcode: 为Xcode带来AI辅助编程的强大扩展 2401_87189860 xcode 人工智能 macos
CopilotForXcode:为Xcode带来AI辅助编程的强大扩展在人工智能快速发展的今天，AI辅助编程工具正在成为开发者提升效率的重要助手。对于使用Xcode进行iOS、macOS等Apple平台开发的Swift程序员来说，一款名为CopilotForXcode的扩展正在受到越来越多的关注。本文将详细介绍CopilotForXcode的主要功能、安装配置过程以及使用技巧，帮助开发者充分利用这
DeepSeek：突破传统的AI算法与下载排行分析 smart_ljh 行业搜索人工智能 AI
DeepSeek的AI算法突破DeepSeek相较于OpenAI以及其它平台的性能对比DeepSeek的下载排行分析（截止2025/1/28AI人工智能相关DeepSeek甚至一度被推上了搜索）未来发展趋势总结在人工智能技术飞速发展的当下，搜索引擎市场也迎来了新的变革。DeepSeek，作为一款基于深度学习技术和大数据算法的搜索引擎，以其独特的优势在国内外市场上引起了广泛关注。下面介绍一下针对De
数学与机器学习：共舞于智能时代的双璧每天五分钟玩转人工智能机器学习人工智能
随着人工智能的崛起，机器学习作为其核心技术之一，正引领着新一轮的科技革命。而在这场革命中，数学以其深邃的理论和精妙的工具，为机器学习提供了坚实的支撑。数学与机器学习之间的关系，如同琴瑟和鸣，共同编织出智能时代的华美乐章。数学，作为自然科学的皇后，以其严谨的逻辑和精确的推理，为机器学习提供了坚实的理论基础。机器学习算法的设计、优化和应用，都离不开数学的支持。无论是线性代数、概率统计，还是微积分、最优
动物产生式识别系统（人工智能实验）不爱编程的程序媛人工智能数据结构算法
1.实验原理首先，定义两个整数数组`base`和`temp`，分别用于存储特征值和临时存储输入的特征值。输出特征值代表的信息，包括每个特征值对应的动物类型。提示输入特征值的总数，并使用`Scanner`类从控制台读取输入。使用循环遍历输入的特征值，将其存储在`temp`数组中，并在`base`数组中将对应特征值的位置设为1。根据输入的特征值，设置`base`数组中其他位置的值。例如，如果输入的特征
大模型应用：探索AI大模型的50个应用场景：让科技改变生活。 AGI大模型资料分享员人工智能科技生活 agi 语言模型自然语言处理
随着人工智能技术的迅猛发展，AI大模型在各个领域的应用日益广泛。百度创始人、董事长兼首席执行官李彦宏在2024年世界人工智能大会上表示，目前AI技术发展路线发生了方向性改变，已从过去辨别式人工智能转向了未来生成式人工智能。他更是呼吁：“大家不要卷模型，要卷应用！”本文将为大家盘点AI大模型的50个应用场景，并按应用频率从高到低进行排列，带您了解AI如何深刻改变我们的工作与生活。1.自然语言处理(N
从模型到实际：人工智能项目落地的关键要素 IT猫仔科技人工智能语言模型自然语言处理搜索引擎服务器机器学习
引言近年来，人工智能技术从实验室走向实际应用，其潜力在各行各业得到了初步的验证。然而，AI技术的落地并非一蹴而就，许多企业在尝试部署AI项目时，却发现自己陷入了“模型很好看，应用却难做”的困境。无论是数据准备不足、算法与场景的不匹配，还是缺乏持续优化的机制，这些问题都可能导致项目停滞，甚至功亏一篑。前排提示，文末有大模型AGI-CSDN独家资料包哦！对于企业来说，人工智能的价值不仅在于模型的高精度
大模型产品架构全景解读：从应用场景到技术支持的完整路径健忘的派大星架构人工智能语言模型 ai agi LLM AI大模型
前言随着人工智能技术的迅猛发展，大模型逐渐成为推动各行业智能化转型的核心动力之一。大模型不仅可以处理大量数据，进行复杂任务的自动化，还能通过微调、蒸馏等技术在特定场景中表现出色。本文将结合大模型产品架构图，详细解读每一个组成模块，帮助读者理解从应用场景到技术支持的完整路径，洞察大模型如何在实际业务中落地。一、落地场景：赋能业务的智能化解决方案大模型的实际价值首先体现在各个业务场景的落地应用中。在架
2000-2021年上市公司数字化转型数据（MD&A报告词频、文本统计） m0_71334485 数据 #上市公司上市公司数字化转型数字化转型上市公司
2000-2021年上市公司数字化转型数据（MD&A报告词频、文本统计）1、时间：2000-2021年2、来源：上市公司NB3、范围：上市公司4、指标：包括人工智能技术、大数据技术、云计算技术、区块链技术、数字技术运用和数字技术应用、互联网商业模式、智能制造、现代信息系统等9个维度175个词频类别、股票代码、股票简称、年报标题、年份、MD&A文本-文本总长度、MD&A文本仅中英文-文本总长度、人工
There was a problem confirming the ssl certificate: [SSL:CERTIFICATE_ VERIFY_ FAILED]certificate解决方案爱编程的喵喵 Python基础课程 python pip SSL certificate 解决方案
大家好，我是爱编程的喵喵。双985硕士毕业，现担任全栈工程师一职，热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多次Top名次。现为CSDN博客专家、人工智能领域优质创作者。喜欢通过博客创作的方式对所学的知识进行总结与归纳，不仅形成深入且独到的理解，而且能够帮助新手快速入门。本文主要介绍了Therewasaproblemco
（新春特辑）腾讯开源MimicMotion整合包，最强图片生成跳舞视频的动作视频模型，动作丝滑没有破绽 struggle2025 人工智能计算机视觉机器学习 AI作画腾讯云AI代码助手
一、项目介绍：（文末提供下载）腾讯图片生成跳舞视频的项目MimicMotion，高质量人类动作视频生成与置信感姿势。亮点：丰富的细节，良好的时间平滑性，以及长视频长度。效果同时支持面部特征和唇形同步，不止可以搞跳舞视频，也可以做数字人。本文信息图片均来源于GitHub开源地址：https://github.com/Tencent/MimicMotion二、效果展示三、概述近年来，生成式人工智能在图
DeepSeek--通向通用人工智能的深度探索者油泼辣子多加专业名词解释人工智能
一、词源与全称“DeepSeek"由"Deep”（深度）与"Seek"（探索）组合而成，中文译名为"深度求索"。其全称为"深度求索人工智能基础技术研究有限公司"，英文对应"DeepSeekArtificialIntelligenceResearchInstitute"。这一命名体现了企业对深度学习技术与未知领域持续探索的双重追求。二、发展历程初创期（2023）公司成立于中国杭州，创始团队汇聚了来自
git clone出现fatal: unable to access Failed to connect to github.com port 443: Timed out解决方案爱编程的喵喵 Python基础课程 git github timeout port 443 解决方案
大家好，我是爱编程的喵喵。双985硕士毕业，现担任全栈工程师一职，热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多次Top名次。现为CSDN博客专家、人工智能领域优质创作者。喜欢通过博客创作的方式对所学的知识进行总结与归纳，不仅形成深入且独到的理解，而且能够帮助新手快速入门。本文主要介绍了gitclone出现fatal:un
flask+layui学生信息管理系统元宇宙中的程序员 flask layui python
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、pandas是什么？二、使用步骤1.引入库2.读入数据总结前言提示：这里可以添加本文要记录的大概内容：例如：随着人工智能的不断发展，机器学习这门技术也越来越重要，很多人都开启了学习机器学习，本文就介绍了机器学习的基础内容。一、数据库建模1、创建数据模型classStudentORM(db.Model):stu_id=d
AI智能制造软件有什么用处雪叶雨林行业资讯 AI 人工智能制造
随着信息技术与制造业的深度融合，人工智能（AI）逐渐成为提升制造效率和灵活性的重要工具。AI智能制造软件通过集成数据分析、机器学习和自动化流程，为企业提供了优化生产、降低成本和提高质量的新途径。生产过程优化实时监控与反馈AI智能制造软件能够实时收集生产线上的各类数据，如温度、压力、速度等参数，并通过机器学习算法进行分析处理。一旦检测到异常情况，系统会立即发出警报并提供改进建议，帮助企业快速响应问题
ModuleNotFoundError: No module named ‘pywin32_bootstrap‘解决方案爱编程的喵喵 Python基础课程 python ModuleNotFound win32_bootstap 解决方案
大家好，我是爱编程的喵喵。双985硕士毕业，现担任全栈工程师一职，热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多次Top名次。现为CSDN博客专家、人工智能领域优质创作者。喜欢通过博客创作的方式对所学的知识进行总结与归纳，不仅形成深入且独到的理解，而且能够帮助新手快速入门。本文主要介绍了ModuleNotFoundErro
人物传记之新月篇暮雨哀尘人物传记篇哈希算法算法 c语言 python pycharm vscode windows
相关故事链接（及时更新）：Python的那些事第四篇：编程中的智慧之光控制结构-CSDN博客目录1.C语言程序：增强版加密与解密工具2.Python程序：增强版加密与解密工具功能对比表格详细功能解释人物传记简介新月，25世纪的杰出女性，以其在编程、人工智能和军事战略领域的卓越成就而闻名。她不仅是一位才华横溢的科学家，还是一位深受尊敬的军事领袖。新月的故事是关于智慧、勇气和创新精神的传奇。早年生活新
MicroAI™将人工智能培训引入RENESAS MCU sinat_41698914 人工智能 mcu big data
在端点部署的人工智能技术将加快资产密集型行业的上市时间达拉斯--(美国商业资讯)--边缘原生人工智能(AI)和机器学习(ML)产品领域的先驱MicroAITM今天宣布，公司已将其MicroAIAtomML™技术与RenesasRA微控制器(MCU)产品线进行整合。与全球微控制器领导者Renesas合作将机器学习引入MCU，并借助MicroAI直接在嵌入式环境中训练机器学习模型的能力——这在业界尚属
DeepSeek R1：中国AI黑马的崛起与挑战码事漫谈 AI 人工智能
文章目录技术突破：从零开始的推理能力进化DeepSeekR1-Zero：纯RL训练的“自我觉醒”DeepSeekR1：冷启动与多阶段训练的平衡之道实验验证：推理能力的全方位跃升基准测试：超越顶尖闭源模型蒸馏技术：小模型的逆袭行业启示：AGI之路的新范式纯RL训练的价值与挑战蒸馏技术的普惠意义开源生态的推动力未来展望：从推理到通用智能结语在人工智能领域，大型语言模型（LLMs）正以迅猛之势重塑我们的
第76期 | GPTSecurity周报云起无垠 GPTSecurity 人工智能网络安全
GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区，集成了生成预训练Transformer（GPT）、人工智能生成内容（AIGC）以及大语言模型（LLM）等安全领域应用的知识。在这里，您可以找到关于GPT/AIGC/LLM最新的研究论文、博客文章、实用的工具和预设指令（Prompts）。现为了更好地知悉近一周的贡献内容，现总结如下。SecurityPapers1.关于使用大语言模型
从简单到深刻的认知发展 AI架构设计之禅计算机软件编程原理与应用实践 java python javascript kotlin golang 架构人工智能
认知发展，人工智能，深度学习，神经网络，机器学习，自然语言处理，计算机视觉1.背景介绍认知发展是人类从简单到复杂的思维方式演进的过程，它涉及感知、记忆、语言、推理和决策等多个方面。随着人工智能技术的飞速发展，我们开始尝试用计算机模拟人类的认知能力，构建能够学习、理解和解决复杂问题的智能系统。从早期的符号逻辑到如今的深度学习，人工智能的发展经历了多个阶段。早期的人工智能研究主要集中在规则和逻辑推理上
2025年1月27日人工智能与科技新闻：DeepSeek震撼全球科技市场海棠AI实验室 AI 瞭望塔人工智能科技
中国AI初创公司DeepSeek震撼全球科技市场DeepSeekR1模型的突破性发展在科技迅猛发展的时代，中国人工智能初创公司DeepSeek推出的R1模型，以其卓越的技术能力，在全球AI领域掀起一场变革。这不仅是技术层面的突破，更对全球科技市场产生深远影响。技术创新与突破全新语言处理架构：提升AI理解和生成能力超越传统模型的认知能力：实现更精准的自然语言推理多模态交互：支持文本、图像、语音等多维
第84期 | GPTSecurity周报云起无垠 GPTSecurity 人工智能 gpt AIGC
GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区，集成了生成预训练Transformer（GPT）、人工智能生成内容（AIGC）以及大语言模型（LLM）等安全领域应用的知识。在这里，您可以找到关于GPT/AIGC/LLM最新的研究论文、博客文章、实用的工具和预设指令（Prompts）。现为了更好地知悉近一周的贡献内容，现总结如下。SecurityPapers1.利用数据流路径对大
redis学习笔记——不仅仅是存取数据 Everyday都不同 returnSource expire/del incr/lpush 数据库分区 redis
最近项目中用到比较多redis，感觉之前对它一直局限于get/set数据的层面。其实作为一个强大的NoSql数据库产品，如果好好利用它，会带来很多意想不到的效果。（因为我搞java，所以就从jedis的角度来补充一点东西吧。PS：不一定全，只是个人理解，不喜勿喷） 1、关于JedisPool.returnSource(Jedis jeids) 这个方法是从red
SQL性能优化-持续更新中。。。。。。 atongyeye oracle sql
1 通过ROWID访问表--索引你可以采用基于ROWID的访问方式情况,提高访问表的效率, , ROWID包含了表中记录的物理位置信息..ORACLE采用索引(INDEX)实现了数据和存放数据的物理位置(ROWID)之间的联系. 通常索引提供了快速访问ROWID的方法,因此那些基于索引列的查询就可以得到性能上的提高. 2 共享SQL语句--相同的sql放入缓存 3 选择最有效率的表
[JAVA语言]JAVA虚拟机对底层硬件的操控还不完善 comsci JAVA虚拟机
如果我们用汇编语言编写一个直接读写CPU寄存器的代码段，然后利用这个代码段去控制被操作系统屏蔽的硬件资源，这对于JVM虚拟机显然是不合法的，对操作系统来讲，这样也是不合法的，但是如果是一个工程项目的确需要这样做，合同已经签了，我们又不能够这样做，怎么办呢？那么一个精通汇编语言的那种X客，是否在这个时候就会发生某种至关重要的作用呢？ &n
lvs- real 男人50 LVS
#!/bin/bash # # Script to start LVS DR real server. # description: LVS DR real server # #. /etc/rc.d/init.d/functions VIP=10.10.6.252 host='/bin/hostname' case "$1" in sta
生成公钥和私钥 oloz DSA 安全加密
package com.msserver.core.util; import java.security.KeyPair; import java.security.PrivateKey; import java.security.PublicKey; import java.security.SecureRandom; public class SecurityUtil {
UIView 中加入的cocos2d，背景透明 374016526 cocos2d glClearColor
要点是首先pixelFormat:kEAGLColorFormatRGBA8，必须有alpha层才能透明。然后view设置为透明glView.opaque = NO;[director setOpenGLView:glView];[self.viewController.view setBackgroundColor:[UIColor clearColor]];[self.viewControll
mysql常用命令香水浓 mysql
连接数据库 mysql -u troy -ptroy 备份表 mysqldump -u troy -ptroy mm_database mm_user_tbl > user.sql 恢复表（与恢复数据库命令相同） mysql -u troy -ptroy mm_database < user.sql 备份数据库 mysqldump -u troy -ptroy
我的架构经验系列文章 - 后端架构 - 系统层面 agevs JavaScript jquery css html5
系统层面：高可用性所谓高可用性也就是通过避免单独故障加上快速故障转移实现一旦某台物理服务器出现故障能实现故障快速恢复。一般来说，可以采用两种方式，如果可以做业务可以做负载均衡则通过负载均衡实现集群，然后针对每一台服务器进行监控，一旦发生故障则从集群中移除；如果业务只能有单点入口那么可以通过实现Standby机加上虚拟IP机制，实现Active机在出现故障之后虚拟IP转移到Standby的快速
利用ant进行远程tomcat部署 aijuans tomcat
在javaEE项目中，需要将工程部署到远程服务器上，如果部署的频率比较高，手动部署的方式就比较麻烦，可以利用Ant工具实现快捷的部署。这篇博文详细介绍了ant配置的步骤（http://www.cnblogs.com/GloriousOnion/archive/2012/12/18/2822817.html），但是在tomcat7以上不适用，需要修改配置，具体如下： 1.配置tomcat的用户角色
获取复利总收入 baalwolf 获取
public static void main(String args[]){ int money=200; int year=1; double rate=0.1; &
eclipse.ini解释 BigBird2012 eclipse
大多数java开发者使用的都是eclipse，今天感兴趣去eclipse官网搜了一下eclipse.ini的配置，供大家参考，我会把关键的部分给大家用中文解释一下。还是推荐有问题不会直接搜谷歌，看官方文档，这样我们会知道问题的真面目是什么，对问题也有一个全面清晰的认识。 Overview 1、Eclipse.ini的作用 Eclipse startup is controlled by th
AngularJS实现分页功能 bijian1013 JavaScript AngularJS 分页
对于大多数web应用来说显示项目列表是一种很常见的任务。通常情况下，我们的数据会比较多，无法很好地显示在单个页面中。在这种情况下，我们需要把数据以页的方式来展示，同时带有转到上一页和下一页的功能。既然在整个应用中这是一种很常见的需求，那么把这一功能抽象成一个通用的、可复用的分页（Paginator）服务是很有意义的。 &nbs
[Maven学习笔记三]Maven archetype bit1129 ArcheType
archetype的英文意思是原型，Maven archetype表示创建Maven模块的模版，比如创建web项目，创建Spring项目等等. mvn archetype提供了一种命令行交互式创建Maven项目或者模块的方式， mvn archetype 1.在LearnMaven-ch03目录下，执行命令mvn archetype:gener
【Java命令三】jps bit1129 Java命令
jps很简单，用于显示当前运行的Java进程，也可以连接到远程服务器去查看 [hadoop@hadoop bin]$ jps -help usage: jps [-help] jps [-q] [-mlvV] [<hostid>] Definitions: <hostid>: <hostname>[:
ZABBIX2.2 2.4 等各版本之间的兼容性 ronin47
zabbix更新很快，从2009年到现在已经更新多个版本，为了使用更多zabbix的新特性，随之而来的便是升级版本，zabbix版本兼容性是必须优先考虑的一点客户端AGENT兼容 zabbix1.x到zabbix2.x的所有agent都兼容zabbix server2.4：如果你升级zabbix server，客户端是可以不做任何改变，除非你想使用agent的一些新特性。 Zabbix代理（p
unity 3d还是cocos2dx哪个适合游戏？ brotherlamp unity自学 unity教程 unity视频 unity资料 unity
unity 3d还是cocos2dx哪个适合游戏？问：unity 3d还是cocos2dx哪个适合游戏？答：首先目前来看unity视频教程因为是3d引擎，目前对2d支持并不完善，unity 3d 目前做2d普遍两种思路，一种是正交相机，3d画面2d视角，另一种是通过一些插件，动态创建mesh来绘制图形单元目前用的较多的是2d toolkit，ex2d，smooth moves，sm2，
百度笔试题：一个已经排序好的很大的数组，现在给它划分成m段，每段长度不定，段长最长为k，然后段内打乱顺序，请设计一个算法对其进行重新排序 bylijinnan java 算法面试百度招聘
import java.util.Arrays; /** * 最早是在陈利人老师的微博看到这道题： * #面试题#An array with n elements which is K most sorted，就是每个element的初始位置和它最终的排序后的位置的距离不超过常数K * 设计一个排序算法。It should be faster than O(n*lgn)。
获取checkbox复选框的值 chiangfai checkbox
<title>CheckBox</title> <script type = "text/javascript"> doGetVal: function doGetVal() { //var fruitName = document.getElementById("apple").value;//根据
MySQLdb用户指南 chenchao051 mysqldb
原网页被墙，放这里备用。 MySQLdb User's Guide Contents Introduction Installation _mysql MySQL C API translation MySQL C API function mapping Some _mysql examples MySQLdb
HIVE 窗口及分析函数 daizj hive 窗口函数分析函数
窗口函数应用场景：（1）用于分区排序（2）动态Group By （3）Top N （4）累计计算（5）层次查询一、分析函数用于等级、百分点、n分片等。函数说明 RANK() &nbs
PHP ZipArchive 实现压缩解压Zip文件 dcj3sjt126com PHP zip
PHP ZipArchive 是PHP自带的扩展类，可以轻松实现ZIP文件的压缩和解压，使用前首先要确保PHP ZIP 扩展已经开启，具体开启方法就不说了，不同的平台开启PHP扩增的方法网上都有，如有疑问欢迎交流。这里整理一下常用的示例供参考。一、解压缩zip文件 01 02 03 04 05 06 07 08 09 10 11
精彩英语贺词 dcj3sjt126com 英语
I'm always here 我会一直在这里支持你 &nb
基于Java注解的Spring的IoC功能 e200702084 java spring bean IOC Office
java模拟post请求 geeksun java
一般API接收客户端（比如网页、APP或其他应用服务）的请求，但在测试时需要模拟来自外界的请求，经探索，使用HttpComponentshttpClient可模拟Post提交请求。此处用HttpComponents的httpclient来完成使命。 import org.apache.http.HttpEntity ; import org.apache.http.HttpRespon
Swift语法之 ---- ?和!区别 hongtoushizi ?swift !
转载自： http://blog.sina.com.cn/s/blog_71715bf80102ux3v.html Swift语言使用var定义变量，但和别的语言不同，Swift里不会自动给变量赋初始值，也就是说变量不会有默认值，所以要求使用变量之前必须要对其初始化。如果在使用变量之前不进行初始化就会报错： var stringValue : String //
centos7安装jdk1.7 jisonami jdk centos
安装JDK1.7 步骤1、解压tar包在当前目录 [root@localhost usr]#tar -xzvf jdk-7u75-linux-x64.tar.gz 步骤2：配置环境变量在etc/profile文件下添加 export JAVA_HOME=/usr/java/jdk1.7.0_75 export CLASSPATH=/usr/java/jdk1.7.0_75/lib
数据源架构模式之数据映射器 home198979 PHP 架构数据映射器 datamapper
前面分别介绍了数据源架构模式之表数据入口、数据源架构模式之行和数据入口数据源架构模式之活动记录，相较于这三种数据源架构模式，数据映射器显得更加“高大上”。一、概念数据映射器（Data Mapper）：在保持对象和数据库（以及映射器本身）彼此独立的情况下，在二者之间移动数据的一个映射器层。概念永远都是抽象的，简单的说，数据映射器就是一个负责将数据映射到对象的类数据。 &nb
在Python中使用MYSQL pda158 mysql python
缘由　　近期在折腾一个小东西须要抓取网上的页面。然后进行解析。将结果放到数据库中。　　了解到 Python在这方面有优势，便选用之。　　由于我有台 server上面安装有 mysql，自然使用之。在进行数据库的这个操作过程中遇到了不少问题，这里记录一下，大家共勉。　　 python中mysql的调用　　百度之后能够通过MySQLdb进行数据库操作。
单例模式 hxl1988_0311 java 单例设计模式单件
package com.sosop.designpattern.singleton; /* * 单件模式：保证一个类必须只有一个实例，并提供全局的访问点 * * 所以单例模式必须有私有的构造器，没有私有构造器根本不用谈单件 * * 必须考虑到并发情况下创建了多个实例对象 * */ /** * 虽然有锁，但是只在第一次创建对象的时候加锁，并发时不会存在效率
27种迹象显示你应该辞掉程序员的工作 vipshichg 工作
1、你仍然在等待老板在2010年答应的要提拔你的暗示。 2、你的上级近10年没有开发过任何代码。 3、老板假装懂你说的这些技术，但实际上他完全不知道你在说什么。 4、你干完的项目6个月后才部署到现场服务器上。 5、时不时的，老板在检查你刚刚完成的工作时，要求按新想法重新开发。 6、而最终这个软件只有12个用户。 7、时间全浪费在办公室政治中，而不是用在开发好的软件上。 8、部署前5分钟才开始测试。

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他