PandaDreamer

【阅读笔记】Interpreting the Latent Space of GANs for Semantic Face Editing

论文名称：Interpreting the Latent Space of GANs for Semantic Face Editing

论文作者：Yujun Shen, Jinjin Gu, Xiaoou Tang, Bolei Zhou

发行时间：Submitted on 15 Dec 2019, last revised 31 Mar 2020

论文地址：https://arxiv.org/abs/1907.10786

代码开源：https://github.com/genforce/interfacegan

一. 概要
二. 模型框架
- 2.1. 潜在空间的语义信息
  - 2.1.1. 单个语义
  - 2.1.2. 多个语义
- 2.2. 操作潜在空间
  - 2.2.1. 仅操作单个语义
  - 2.2.2. 条件性操作
  - 2.2.3. 操作真实图像
三. 实验
- 3.1.潜在空间的可分性
- 3.2. 潜在空间的可操控性
  - 3.2.1. 操控单一属性
  - 3.2.2. 语义子空间的距离效应
  - 3.2.3. 伪影修正
- 3.3. 条件操作
  - 3.3.1. 各属性之间相关性
  - 3.3.2. 条件操作
- 3.4. StyleGAN结果
- 3.5. 真实图像操控
四. 实现细节

一. 概要

本文提出了一个新颖的框架 InterFaceGAN ，即通过对 GAN 学习到的潜在语义信息进行解释来实现对人脸的语义信息编辑。本文研究了不同的语义如何编码到用于人脸合成的 GANs 潜在空间中，探究了各种语义之间的解耦及利用子空间投影来对已经耦合的一些语义进行解耦，实现了对面部属性更加精准的操控来实现人脸编辑。本文的人脸编辑不但可以操控性别、年龄、表情、眼镜外，还可以对原图的面部姿势进行修改，甚至能修复 GAN 模型中意外产生的伪影。将文中提出的方法同 GAN 反编码算法或引入编码器模型相结合，可对真实图像进行可控且解耦的属性表征。

InterFaceGAN 全称是：Interpreting Face GANs , 用来识别训练良好的脸部合成模型在潜在空间的语义，并利用其来进行语义人脸编辑。本文的主要贡献如下：

使用 InterFaceGAN 来探究如何在 GAN 的潜在空间中对单个或多个语义进行编码。
证明了 InterFaceGAN 可使用任何预训练好的固定 GAN来进行脸部语义编辑。（效果图如下图所示）
利用对真实图像也进行了语义编辑。

二. 模型框架

分析了 latent code 的语义属性。
构造使用 latent code 语义编辑面部的操作过程。

2.1. 潜在空间的语义信息

对于任一训练完毕的 GAN 模型，其生成器的函数表示为 $g:~\mathcal{Z} \to \mathcal{X}$ ，其中 $\mathcal{Z} \subseteq \mathbb{R}^d$ 代表 $d$ 维的潜在空间，该空间遵循多元正态分布 $\mathcal{N}(0,{\rm I}_d)$ ；而 $\mathcal{X}$ 表示图像空间，其中的每个样本 $x$ 都具有一定的语义信息。定义一语义得分函数 $f_s：~\mathcal{X}\to \mathcal{S}$ ，其中 $\mathcal{S} \subseteq \mathbb{R}^m$ 代表 $m$ 维的语义空间。于是便从潜在空间 $\mathcal{Z}$ 变换到了语义空间 $\mathcal{S}$ ：
$s=f_{\mathcal{S}}(g(z))$
其中， $s$ 表示语义分数， $z$ 表示采样得到的潜在代码。

属性 1： 给定 $\in \mathbb{R}^d$ 且 $\neq 0$ ，使用集合 $\left \{ z \in \mathbb{R}^d:~n^Tz=0 \right \}$ 定义了在 $\mathbb{R}^d$ 的一个超平面，其中 $n$ 称为法向量。这里所有的向量 $\in \mathbb{R}^d$ 都满足在超平面的同一侧内 $n^Tz > 0$ 必成立。

属性 2： 给定 $\in \mathbb{R}^d$ 且 $n^Tn=1$ ，其定义了一个超平面。一个遵循多元正态分布的随机变量 $\sim \mathcal{N}(0,{\rm I}_d)$ 。对于任何满足 $\alpha \geq 1$ 和 $d\geq 4$ ，有 $P(|n^Tz| \leq 2\alpha\sqrt{\frac{d}{d-2}}) \geq(1-3e^{-cd})(1-\frac{2}{\alpha}e^{-\alpha^2/2})$ 。其中， $P(\cdot)$ 表示概念， $c$ 是一个固定的正常数。

具体证明可见原论文，在此不做过多阐述。

2.1.1. 单个语义

诸多实验证明对两个潜码 $z_1$ 和 $z_2$ 进行线性变换（如： $z=\lambda z_1 + (1-\lambda)z_2$ ）时，相应产生的合成结果是连续变化的。它隐含地意味着图像中包含的语义也在逐渐变化。根据 属性 1，对两个潜码 $z_1$ 和 $z_2$ 进行线性变换会在 $\mathcal{Z}$ 上形成一个方向，这进一步定义了超平面。

文中作出了一个设想，**对于任何的二元语义，其在潜在空间汇总都存在一个边界。但潜码在边界的一侧内移动（不穿过边界）时，其语义保持不变；而一旦潜码的变换越过边界进行移动时，语义就会变得相反。**移动情况如下图所示：

给定一带有单位法向量 $\in \mathbb{R}^d$ 的超平面，定义样本 $z$ 到超平面的距离为
$d(n,z)=n^Tz$
此处的 $d(\cdot,\cdot)$ 并非严格定义的距离，它可以是负数表示语义被反转。当 $z$ 位于边界附近且在超平面上移动时，距离和语义得分都会对应发生改变。一旦距离变成了负数，就表示语义属性发生了逆转。我们期望距离和语义信息是呈现线性相关的：
$f(g(z))=\lambda d(n,z)$
其中 $f(\cdot)$ 是参与的语义的得分， $\lambda > 0$ 是用来用来测量语义随距离变化的快慢的标量。根据 属性 2，从 $\mathcal{N}(0,{\rm I}_d)$ 中随机采样的样本很大概率会定位到离给定超平面足够近的位置。因此，对应的语义可以用 $n$ 所定义的线性子空间来建模。

2.1.2. 多个语义

假设有 $m$ 个不同语义，则有
$s\equiv f_{\mathcal{S}}(g(z))= \Lambda N^Tz$
其中， $s=[s_1,\cdots,s_m]^T$ 表示语义得分， $\Lambda = {\rm diag}(\lambda_1,\cdots,\lambda_m)$ 是一个包含线性系数的对角矩阵， $N=[n_1,\cdots,n_m]$ 表示分离边界。 $z$ 是从 $\mathcal{N}(0,{\rm I}_d)$ 中随机采样的样本，那么 $s$ 的均值和协方差矩阵的计算为：
$\mu_s=\mathbb{E}(\Lambda N^T z)=\Lambda N^T \mathbb{E}(z)=0 \\ \sum_s=\mathbb{E}(\Lambda N^T z z^T N \Lambda^T)= \Lambda N^T \mathbb{E}(zz^T)N \Lambda^T=\Lambda N^TN\Lambda$
因此，得到遵循多元正态分布的 $s\sim \mathcal{N}(0,\sum_s)$ 。要想在 $s$ 中各个不同的项之间都是项目解耦的，必须满足 $\sum_s$ 为对角矩阵，即在 $N=[n_1,\cdots,n_m]$ 中的两两之间彼此正交。一旦不能满足这一条件，则在 $s$ 中一定会存在一些会产生纠缠的语义。因此，我们可用 $n_i^Tn_j$ 来衡量第 $i$ 个语义和第 $j$ 个语义之间的纠缠度。

2.2. 操作潜在空间

2.2.1. 仅操作单个语义

根据单个语义中语义得分和距离存在的线性关系，可编辑原始的潜在编码 $z$ ： $z_{edit}=z+\alpha n$ 。即当 $\alpha>0$ 时，其编辑的语义会使得合成的图像看起来更加积极，因为语义得分变成了 $f(g(z_{edit}))=f(g(z))+\lambda\alpha$ 。同理，当 $\alpha<0$ 时，其合成的会看起来更加消极。

2.2.2. 条件性操作

存在多个属性时，可能会有一些耦合的语义，一旦修改其中一个会产生连锁反应影响其他语义，会影响精准编辑面部。为了避免之，文中提出手动将 $N^TN$ 强制为对角矩阵。实现该条件的方法是利用投影来使得不同的向量正交化。如上图所示，我们给定两个超平面和对应的法向量 $n_1$ 和 $n_2$ ，我们找到了一个新的投影方向 $n_1-(n_1^Tn_2)n_2$ ，只要沿着这个方向移动的样本就可以仅对 “属性 1” 进行编辑而不影响 “属性 2”。因为从图中可看出新方向正交于 $n_2$ ，移动往该方向不会影响到 $n_2$ 。我们把这个操作就叫做条件性操作。若有一个以上的属性需要被限制，我们只需让原始方向减去所有限定方向所构成的平面上的投影。

2.2.3. 操作真实图像

首先使用对潜在编码进行梯度回传或额外引入一个编码器来将真实图像映射成潜在编码，然后再对其潜在编码 $z$ 进行操控以实现编辑真实图像的目的。

三. 实验

在本章中，作者分别对以下三个方面进行了实验：

3.1，3.2，3.3 从 PGGAN 出发，对传统生成器中的潜在空间进行了解释
3.4 从 StyleGAN 出发，对基于style的生成器中的潜在空间进行了解释
3.5 从真实图像入手，说明了 GAN 如何将学到的语义用于人脸编辑

3.1.潜在空间的可分性

文中使用了 SVM 对在 2.1 中二元语义的可分性进行了验证，证明了假设的正确性。

我们对一些样本到边界的距离进行了排序，得到上图可视化结果。如上图所示，第一行和最后一行的两类极端情况是无法通过直接采样获取到的，只能通过尽可能"无限"地将潜在代码移向法线方向得到。图中显示了正负样本的可区分性。

3.2. 潜在空间的可操控性

3.2.1. 操控单一属性

上图是对5个属性的语义操控，可见在所有属性上都表现良好。特别是姿态属性，观察到即使通过解决双分类问题来搜索边界，移动潜在代码也会产生连续的变化。此外，尽管在训练集中缺乏足够的极端姿势的数据，GAN能够想象侧面脸应该是什么样子。同样的情况也发生在眼镜属性上。虽然训练集的数据不充分，但是可以手动创建很多戴着眼镜的面孔。这两个观察结果有力地证明了GAN并不是随机生成图像的，而是从潜在空间中学习了一些可解释的语义。

3.2.2. 语义子空间的距离效应

距离效应指当样本离边界过远时（ $-\inf$ 或 $\inf$ ），其产生的图像外表会验证地变形，这从 Figure 3 中上下两端的图像可看出。如上图所示，当我们仅对性别属性操控于边界处附近对人脸部信息，人脸的结构保存的很好，而一旦超过一定的区域时，人脸结构就会发生变形。但这种效应并不影响我们对潜空间中解纠缠语义的理解，这是因为这种极端样本不太可能直接从标准正态分布中提取，相反，它们是通过沿着一定的方向不断移动采样得到的潜在代码来手工构造的。这样可以更好地解释GANs的潜在语义。

3.2.3. 伪影修正

文中通过实验发现 GAN 同样将伪影信息编码到了潜在空间中。基于此，文中将伪影视为一个可操控的属性，将其潜码往该属性的积极方向移动，成功消除了伪影。消除结果如上图所示，效果还不错。

3.3. 条件操作

本小结进行了如下两点：

不同属性之间的解耦
评估了条件操作方法

3.3.1. 各属性之间相关性

本文的关注点是不同隐藏语义之间的关系，并研究它们是如何相互耦合的。因此，本文使用了两种不同的指标来衡量两种属性的相关度：

余弦相似度： $cos(n_1,n_2)=n_1^Tn_2$ ，其中 $n_1$ 和 $n_2$ 都表示两种属性对应的单位法向量。
相关系数：将每个属性的得分作为一个随机变量，将所有50万个综合数据所观测到的属性分布来计算相关系数 $\rho$ 。那么有 $\rho_{A_1A_2}=\frac{Cov(A_1,A_2)}{\sigma_{A_1}\sigma{A_2}}$ ，其中 $A_1$ 和 $A_2$ 表示对应于两个属性得分， $Cov(\cdot,\cdot)$ 表示协方差， $\sigma$ 表示标准差。

上面这个表格便是使用这两种指标的结果，可见属性在这两个度量下的行为是相似的，这表明提出的 InterFaceGAN 能够准确地识别隐藏在潜在空间中的语义。此外，从表中可看出性别、年龄和眼镜这三个属性是高度相关的，这个观察结果反映了训练数据集中的属性相关性。例如，该数据集中的男性老年人更有可能戴眼镜。GAN在学习产生真实观察时也捕捉到了这一特点。

3.3.2. 条件操作

上图显示了将一个属性固定作为条件而对另一个属性进行操作的结果，以左侧结果为例，文中将性别方向固定为条件，然后对年龄进行编辑，其通过让年龄方向减去性别方向的投影来得到一个新方向，这样可确保当样本沿着投影的新方向移动时，性别成分不会发生改变，而年龄却会改变。

上图则是在将多个属性固定作为条件而对另一个属性操作的结果，这里则是将年龄和性别固定，往人脸上增加眼镜。最开始时，增加眼镜与改变年龄和性别是纠缠在一起的。但通过投影操作后，在不影响年龄和性别的情况下，成功地增加了眼镜。这两个实验表明，我们提出的条件操纵有助于实现独立和精确的属性控制。

3.4. StyleGAN结果

StyleGAN 中的生成器是基于样式的生成器，其首先将潜在编码从 $\mathcal{Z}$ 映射到了更高维的空间 $\mathcal{W}$ 中，然后将 $\mathcal{W}$ 输入到生成器中，StyleGAN 证明了 $\mathcal{W}$ 能更好地模拟真实数据的底层特征。

如上图所示， $\mathcal{W}$ 空间确实比 $\mathcal{Z}$ 空间要晚出现眼镜；条件操控于 $\mathcal{Z}$ 空间的解耦能力要优于单独的使用 $\mathcal{W}$ 空间。虽然 StyleGAN 中 $\mathcal{W}$ 的解耦能力确实比 $\mathcal{Z}$ 要好，但却不能用我们提出的投影方法用于 $\mathcal{W}$ 空间。因为文中发现 $\mathcal{W}$ 空间有时捕获了训练集中数据之间存在的属性相关性，并将其编码成了耦合的样式。以上图为例， $\mathcal{W}$ 空间学到了一种包含了眼镜语义的年龄语义投影，但这个方向在某种程度上又和眼镜语义方向是垂直的，我们所描述的减去眼镜投影相当于减去了一个零向量，几乎不会对结果又任何影响。

3.5. 真实图像操控

首先需要将真实图像转换成潜在编码，这里有两种转换机制：

基于优化的方法，利用固定生成器直接优化潜在代码，使像素级重构误差最小化
基于编码器的方法，其中额外的编码器网络被训练来学习逆映射（图像转潜在编码）

本小结对这两种方法在 PGGAN 和 StyleGAN 上进行了实验。实验结果如下图。

如上图所示，在 PGGAN 中的两种转换机制生成的效果图都较差，可见传统生成器架构的 GAN 对训练数据和测试数据之间的差异性过于敏感。虽然生成的效果图很差，但仍可以用我们的 InterFaceGAN 方法对面部属性进行编辑。

如上图所示，在 StyleGAN 中的基于优化方法的效果要好得多。值得注意的是，这里的优化目标是每层的样式（所有层里的 $w$ ）。在编辑实例的过程中，将所有的样式编码都推向同一个方向。无需再训练StyleGAN，仅仅利用了潜在空间的解释语义，便成功地更改了真实人脸图像的属性。

此外还测试了 InterFaceGAN 在编码器-解码器生成模型（让编码器与生成器和判别器同时参与训练）里的效果。即一旦模型收敛，便直接使用编码器进行推理将给定图像映射到潜在空间。文中将 InterFaceGAN 方法来解释最近的编解码器模型 LIA 的潜在空间。实验结果如上图所示，可见其也支持语义编辑。此外，同上述由 PGGAN 中模型准备好后再单独学习编码器相比，编码器和生成器一起训练的模型明显有更好的重构和操作结果。

四. 实现细节

本文选择了五个关键的面部特征进行分析，包括姿势、微笑、年龄、性别和眼镜。相应的“正方向”被定义为向右转、大笑、变老、男性化和戴眼镜。注意，只要属性检测器可用，我们总是可以轻松插入更多属性。

使用自CelebA数据集的注释和ResNet50网络训练了一个辅助属性预测模型。这个模型接受了多任务损失训练，以同时预测微笑、年龄、性别、眼镜以及5点面部标志（确定面部框架）。这里，人脸标示将被用来计算姿势的偏移，在进一步的分析中也被当作二元属性（左或右）来处理。**除面部标志外，所有的属性都用 softmax 交叉损失的双分类问题，面部标志用 $l_2$ 回归损失进行优化。**由于 PGGAN 和 StyleGAN 的图像分辨率为 $1024\times 1024$ ，我们在将其输入属性模型之前将其大小调整为 $224\times224$ 。

在预先训练好的 GAN 模型的基础上，对潜在空间进行随机采样，生成了 $500$ K 幅图像。之所以要准备这样大规模的数据，主要有两个原因：

消除抽样带来的随机性，通过大规模数据来确保潜在编码的分布符合预期分布。
通过大规模数据来确保训练集中有足够多的戴眼镜样本，因为 PGGAN 模型中很少生成这一类样本。

为了找到潜在空间中的语义边界，我们使用预先训练好的属性预测模型对 $500$ K 个合成的图像进行属性评分。对于每个属性，我们对相应的得分进行排序，选择得分最高的10K个样本和得分最低的10K个样本作为候选。这样做的原因是，预测模型不是绝对准确的，可能会对模糊的样本产生错误的预测，例如对年龄属性的预测是中年人。然后从候选样本中随机抽取 $\%$ 的样本作为训练集学习线性支持向量机，得到一个决策边界。其中，所有边界的法向量都归一化为单位向量。剩下的30%用于验证线性分类器的分类效果。在SVM训练中，输入为 $512$ 维的潜码，二值标签由辅助属性预测模型分配。

求是网：“内卷式”竞争的突出表现和主要危害有哪些？加百力财经研究科技知识人工智能大数据
"内卷式"竞争主要表现为：企业层面的低价竞争、同质化竞争和营销"逐底竞争"；地方政府层面的违规优惠政策、盲目重复建设和设置市场壁垒。危害体现在三个层面：微观上导致"劣币驱逐良币"，损害消费者利益；中观上破坏行业生态，挤压产业链利润空间；宏观上扭曲资源配置，抑制创新活力。什么是“内卷式”竞争？概括其一般特征，是指经济主体为了维持市场地位或争夺有限市场，不断投入大量精力和资源，却没有带来整体收益增长的
【LeetCode 热题 100】24. 两两交换链表中的节点——（解法一）迭代+哨兵 xumistore LeetCode leetcode 链表算法 java
Problem:24.两两交换链表中的节点题目：给你一个链表，两两交换其中相邻的节点，并返回交换后链表的头节点。你必须在不修改节点内部的值的情况下完成本题（即，只能进行节点交换）。文章目录整体思路完整代码时空复杂度时间复杂度：O(N)空间复杂度：O(1)整体思路这段代码旨在解决一个经典的链表操作问题：两两交换链表中的节点(SwapNodesinPairs)。问题要求将链表中每两个相邻的节点进行交换
LeetCode 148. 排序链表：归并排序的细节解析进击的小白菜 2025 Top100 详解 leetcode 链表算法
文章目录题目描述一、方法思路：归并排序的核心步骤二、关键实现细节：快慢指针分割链表1.快慢指针的初始化问题2.为什么选择`fast=head.next`？示例1：链表长度为偶数（`1->2->3->4`）三、完整代码实现四、复杂度分析五、总结题目描述LeetCode148题要求对链表进行排序，时间复杂度需为O(nlogn)，且空间复杂度为O(logn)。由于链表的特殊结构（无法随机访问），归并排序
嵌入式系统LCD显示模块编程实践
本文还有配套的精品资源，点击获取简介：本文档提供了一个具有800x480分辨率的3.5英寸液晶显示模块LW350AC9001的驱动程序代码，以及嵌入式系统中使用C/C++语言进行硬件编程的实践指南。该模块的2mm厚度使其适用于空间受限的便携式设备。内容包括驱动程序源代码、硬件控制接口使用方法，以及如何在嵌入式系统中进行图形处理、电源管理与性能优化。1.嵌入式系统原理1.1嵌入式系统概念嵌入式系统是
霍夫变换（Hough Transform）算法原来详解和纯C++代码实现以及OpenCV中的使用示例点云SLAM 算法图形图像处理算法 opencv 图像处理与计算机视觉算法直线提取检测目标检测霍夫变换算法
霍夫变换（HoughTransform）是一种经典的图像处理与计算机视觉算法，广泛用于检测图像中的几何形状，例如直线、圆、椭圆等。其核心思想是将图像空间中的“点”映射到参数空间中的“曲线”，从而将形状检测问题转化为参数空间中的峰值检测问题。一、霍夫变换基本思想输入：边缘图像（如经过Canny边缘检测）输出：一组满足几何模型的形状（如直线、圆）关键思想：图像空间中的一个点→参数空间中的一个曲线参数空
Shader面试题100道之（81-100）还是大剑师兰特 #Shader 综合教程100+大剑师 shader面试题 shader教程
Shader面试题（第81-100题）以下是第81到第100道Shader相关的面试题及答案：81.Unity中如何实现屏幕空间的热扭曲效果（HeatDistortion）？热扭曲效果可以通过GrabPass抓取当前屏幕图像，然后在片段着色器中使用噪声或动态UV偏移模拟空气扰动，再结合一个透明通道控制扭曲强度来实现。82.Shader中如何实现物体轮廓高亮（OutlineHighlight）？轮廓
Java三年经验程序员技术栈全景指南：从前端到架构，对标阿里美团全栈要求可曾去过倒悬山 java 前端架构
Java三年经验程序员技术栈全景指南：从前端到架构，对标阿里美团全栈要求三年经验是Java程序员的分水岭，技术栈深度决定你成为“业务码农”还是“架构师候选人”。本文整合阿里、美团、滴滴等大厂招聘要求，为你绘制可落地的进阶路线。一、Java核心：从语法糖到JVM底层三年经验与初级的核心差异在于系统级理解，大厂面试常考以下能力：JVM与性能调优内存模型（堆外内存、元空间）、GC算法（G1/ZGC适用场
javascript高级程序设计第3版——第12章 DOM2与DOM3 weixin_30687587 javascript 数据结构与算法 ViewUI
12章——DOM2与DOM3为了增强D0M1，DOM级规范定义了一些模块。DOM2核心：为不同的DOM类型引入了一些与XML命名空间有关的方法，还定义了以编程方式创建Document实例的方法；DOM2级样式：针对操作元素的样式而开发；其特性总结：1.每个元素都有一个关联的style对象，可用来确定和修改行内样式；2.要确定某个元素的计算样式，可使用getComgetComputedStyle（）
Linux中LVM逻辑卷扩容
在Linux系统中对根目录所在的LVM逻辑卷进行扩容，需要依次完成物理卷扩容➔卷组扩容➔逻辑卷扩容➔文件系统扩容四个步骤。以下是详细操作流程：一、确认当前磁盘和LVM状态#1.查看磁盘空间使用情况df-h/#2.查看块设备及LVM层级关系lsblk#3.查看LVM详细信息（物理卷PV、卷组VG、逻辑卷LV）pvdisplayvgdisplaylvdisplay二、扩容物理卷（PV）场景1：已有未分
【unity编辑器开发与拓展EditorGUILayoyt和GUILayoyt】死也不注释 Unity编辑器开发与拓展笔记 unity 编辑器游戏引擎
EditorGUILayout与GUILayout的核心区别及使用场景详解一、对比表特性GUILayoutEditorGUILayout命名空间UnityEngineUnityEditor使用场景运行时UI+编辑器扩展仅限编辑器扩展控件风格基础游戏风格（无编辑器优化）原生Unity编辑器风格布局复杂度基础流式布局高级自动布局（带标签对齐/间距优化）序列化支持❌不支持✅直接支持SerializedP
【DBC】DBC中CAN信号多路复用徐饼干 DBC 程序人生其他经验分享
DBC文件信号多路复用详解1何时定义有些信号比较长，但是又不常用，就可以定义多路复用信号以节约空间。2具体定义2.1定义一个短信号来当做“控制开关”。【若定义1bit，则有2种可能0x00和0x01，复用两路】【若定义2bit，则有4种可能0x00和0x01和0x10和0x11，复用四路】…所以说，这个短信号的长度和你想复用多少路有关，多长？放在什么位置？由定义者决定2.2节约空间是如何体现的现在
C++函数签名
C++函数签名-CSDN博客函数签名的组成部分函数名称函数的名字（如calculate、print）。参数列表（ParameterList）参数的类型、顺序和数量。参数的名字不影响签名（如intfunc(inta)和intfunc(intb)是同一签名）。所属的类或命名空间成员函数属于特定类（如MyClass::method）。自由函数属于全局或某个命名空间。成员函数的const/volatile
【运维实战】解决 K8s 节点无法拉取 pause:3.6 镜像导致 API Server 启动失败的问题 gs80140 各种问题运维 kubernetes 容器
目录【运维实战】解决K8s节点无法拉取pause:3.6镜像导致APIServer启动失败的问题问题分析✅解决方案：替代拉取方式导入pause镜像Step1.从私有仓库拉取pause镜像Step2.重新打tag为Kubernetes默认命名Step3.导出镜像为tar包Step4.拷贝镜像到目标节点Step5.在目标节点导入镜像到containerd的k8s.io命名空间Step6.验证镜像是否导
redis管道 -redis pipeline -redis pipelining shuair redis redis bootstrap 数据库
redis管道文档redis单机安装redis常用的五种数据类型redis数据类型-位图bitmapredis数据类型-基数统计HyperLogLogredis数据类型-地理空间GEOredis数据类型-流Streamredis数据类型-位域bitfieldredis持久化-RDBredis持久化-AOFredis持久化-RDB+AOF混合模式redis事务官方文档官网操作命令指南页面：https
数据结构：导论梁辰兴数据结构学习笔记数据结构导论算法时间复杂度空间复杂度
目录一，数据结构的研究内容二，基本概念与术语（一）数据、数据元素、数据项与数据对象（二）数据结构（三）数据类型与抽象数据类型️三，抽象数据类型的表示与实现⚙️四，算法与算法分析⚖️（一）算法的定义及特性（二）评价算法优劣的基本标准⏱️（三）算法的时间复杂度（四）算法的空间复杂度章结一，数据结构的研究内容数据结构是计算机科学的核心基础，其研究内容可概括为三大维度：数据组织形式：探索如何将现实世界中的
redis中什么是bigkey？会有什么影响？ Vic2334 redis
什么是bigkey？会有什么影响？bigkey是指key对应的value所占的内存空间比较大，例如一个字符串类型的value可以最大存到512MB，一个列表类型的value最多可以存储23-1个元素。如果按照数据结构来细分的话，一般分为字符串类型bigkey和非字符串类型bigkey。字符串类型：体现在单个value值很大，一般认为超过10KB就是bigkey，但这个值和具体的OPS相关。非字符串
《C++性能优化指南》 linux版代码及原理解读第四章 v俊逸 C++性能优化指南性能优化 C++性能优化指南性能优化
目录概述为什么字符串很麻烦字符串是动态分配的字符串赋值背后的操作如何面对字符串会进行大量复制写时复制COW（copyonwrite）尝试优化字符串避免临时字符串通过预留存储空间减少内存分配通过传递引用减少实参复制使用迭代器操作减少循环中的比较操作减少返回值的复制还没有结束，使用字符数组代替字符串再次优化字符串尝试其他的算法叠加以前的优化方式使用其他的编译器使用其他字符串的库功能丰富的字符串库使用s
微算法科技的前沿探索：量子机器学习算法在视觉任务中的革新应用 MicroTech2025 量子计算算法
在信息技术飞速发展的今天，计算机视觉作为人工智能领域的重要分支，正逐步渗透到我们生活的方方面面。从自动驾驶到人脸识别，从医疗影像分析到安防监控，计算机视觉技术展现了巨大的应用潜力。然而，随着视觉任务复杂度的不断提升，传统机器学习算法在处理大规模、高维度数据时遇到了计算瓶颈。在此背景下，量子计算作为一种颠覆性的计算模式，以其独特的并行处理能力和指数级增长的计算空间，为解决这一难题提供了新的思路。微算
AI技术正在深刻重塑A/B测试优化的流程、效率和价值，推动其从传统的“手动实验”向“智能优化引擎”跃迁。 zzywxc787 人工智能
AI技术正在深刻重塑A/B测试优化的流程、效率和价值，推动其从传统的“手动实验”向“智能优化引擎”跃迁。以下是具体变革方向及实际影响：1.实验设计智能化：告别“猜猜看”传统痛点：依赖经验选择测试变量（如按钮颜色、文案），忽略潜在高价值组合。AI解决方案：多臂老虎机算法（MAB）：动态分配流量至表现最优的变体（如：80%流量给当前最优，20%探索新选项），减少流量浪费高达70%（Netflix案例）
docker常见问题解决方法小王聊技术 docker
目录迁移至其他服务器清理Docker占用的磁盘空间常见问题：迁移至其他服务器1.将docker容器导出dockerexport-o保存路径/xxx.tar容器id2.将容器tar远程拷贝到新的服务器(从新的服务器上向老服务器上请求复制)scproot@服务器地址:/data/xxx.tar/root3.将导入的tar包转为镜像dockerimport-cxxx.tarimage_name:tag
如何将音乐从 iPhone 传输到Mac ？ 5种有效方法解决 Coolmuster iPhone iOS 苹果手机 iphone macos ios
有时，无论是要释放iPhone上的存储空间、备份音乐文件还是在计算机上欣赏iPhone音乐，您都需要将音乐从iPhone传输到Mac。那么，如何将音乐从iPhone传输到Mac呢？虽然不像将照片传输到Mac那么简单，但仍然有很多方法可以做到。现在让我们来看看它们吧！第1部分：如何在没有iTunes的情况下将音乐从iPhone传输到Mac（包括未购买的歌曲）许多人说，由于iTunes的限制，很难将音
如何将大视频文件从 iPhone 传输到 PC？ Coolmuster iPhone iOS 苹果手机 iphone ios
假设您的iPhone充满了大视频文件（超过1GB），这可能会迅速消耗存储空间并导致设备运行缓慢。幸运的是，您可以将这些大型视频文件从iPhone传输到PC，以释放存储空间或在上传到社交媒体之前进行编辑。方式1：如何通过专业工具将iPhone中的大视频传输到电脑CoolmusteriOSAssistant是一款多功能且用户友好的软件，旨在促进从计算机高效管理iOS设备。它提供了一系列功能来简化iOS
LLM Agent在多模态任务中的推理机制详解
文章目录一、引言二、多模态LLMAgent的基本架构2.1系统组成2.2工作流程图三、多模态表示与对齐3.1跨模态嵌入空间3.2模态对齐技术四、多模态推理策略4.1基于提示的推理(Prompt-basedReasoning)4.2多模态思维链(CoT)推理4.3多模态工具使用五、实现案例：多模态问答系统5.1系统架构5.2示例应用六、高级多模态推理技术6.1多模态递归推理6.2多模态记忆与检索6.
资源分享-FPS, 矩阵, 骨骼, 绘制, 自瞄, U3D, UE4逆向辅助实战视频教程小零羊矩阵 3d ue4
文章底部获取资源教程概述本视频教程专为游戏开发者和安全研究人员设计，涵盖FPS游戏设计、矩阵运算、骨骼绘制、自瞄算法、U3D和UE4逆向辅助等实战内容。通过102节详细视频教程，您将掌握从基础到高级的游戏开发与安全防护技能。教程内容1.FPS类型游戏的设计研究和游戏安全,反外挂研究2.二维向量和平面距离3.atan2和tan4.三维向量和空间距离5.补充向量乘法6.矩阵和矩阵的运算7.矩阵的特性8
map数据结构在Golang中是无序的，并且键值对的查找效率较高的原因
map，map在Go语言中是无序的，是因为在Go语言中，map基于哈希表实现，它的遍历顺序依赖于哈希表内部存储状态，对并发编程的潜在影响包括可能引发数据一致性问题，也就是并发度写实易导致读到不一样的数据或遍历出错；还会导致结果可重复性的问题，即每次运行程序得到的依赖遍历顺序的计算结果可能不同。map的键值对查找效率高是由于：（1）哈希表的时间复杂度，哈希表的平均复杂度为O（1），最欢情况下为O（n
车身焊接机器人系列编程：Yaskawa MA2010_（11）.机器人维护与保养 zhubeibei168 机器人（二）机器人网络
机器人维护与保养1.机器人维护的必要性在汽车制造行业中，车身焊接机器人（如YaskawaMA2010）的高效运行对于生产线的稳定性和生产质量至关重要。机器人维护不仅能够延长机器人的使用寿命，还能确保其在长时间运行中的性能稳定。维护工作主要包括定期检查、清洁、润滑、更换易损件和故障诊断等。本节将详细介绍这些维护工作的具体步骤和注意事项。2.定期检查定期检查是机器人维护的基础，可以及时发现潜在问题并进
Spring 声明式事务管理（注解方式） LMGD Spring spring
注解方式实现声明式事务管理1、在Spring配置文件中配置事务管理器2、在Spring配置文件中，开启事务注解（1）在Spring配置文件引入名称空间tx（2）开启事务注解3、在server类上(或方法上)添加事务注解@Transactional（1）@Transactional，这个注解可以添加到类上、方法上（2）如果把这个注解添加到类上，这个类里所有方法都添加事务（3）如果把这个注解添加到方法
如何从性能菜鸟变性能大咖之------jvm 内存颜挺锐 jvm 性能测试压力测试性能优化
理解JVM（Java虚拟机）内存的性能优化，需要从JVM内存模型、垃圾回收机制、以及如何通过参数调优来提高应用程序的性能等方面入手。以下是对JVM内存性能优化的详细解读：一、JVM内存模型JVM内存模型主要包括以下几个区域：堆内存（Heap）：堆内存是JVM管理的最大一块内存空间，用于存放对象实例和数组。堆内存分为年轻代（YoungGeneration）和老年代（OldGeneration）。年轻
沙箱机制（Sandbox Mechanism） IT 青年 0o 网安
前言沙箱机制（SandboxMechanism）是一种安全隔离技术，通过创建一个受限制的执行环境，将潜在不安全的程序、代码或数据与系统核心部分隔离，防止其对系统或用户数据造成破坏。一、核心原理资源限制：分配独立的内存空间、文件系统、网络接口等资源。限制CPU、内存、磁盘I/O等资源的使用量，防止恶意程序占用过多资源。权限控制：剥夺沙箱内程序的敏感权限（如访问系统文件、注册表、摄像头等）。通过访问控
创世理论达成科学家解释不了的暗能量我也能解释有啥不好意思的 qq_36719620 人工智能量子计算 java python 算法
好的，我们将进行一场完全摒弃数学符号的纯粹概念推导，彻底揭示“绝对闭合宇宙理论”框架下暗能量的本质。以下是绝对自洽的逻辑链条：第零步：宇宙基石-维度交织的全景结构宇宙总框架：宇宙并非仅是我们感知的三维空间加一维时间。它是一个由24个基本维度紧密编织而成的单一、自洽实体。这些维度分为五组：实时间组(3维)：这就是我们感知到的时间流逝的方向，但它不是一个单向箭头，而更像一个三维的“时间空间”，允许更复
jvm调优总结（从基本概念到深度优化） oloz java jvm jdk 虚拟机应用服务器
JVM参数详解：http://www.cnblogs.com/redcreen/archive/2011/05/04/2037057.html Java虚拟机中，数据类型可以分为两类：基本类型和引用类型。基本类型的变量保存原始值，即：他代表的值就是数值本身；而引用类型的变量保存引用值。“引用值”代表了某个对象的引用，而不是对象本身，对象本身存放在这个引用值所表示的地址的位置。
【Scala十六】Scala核心十：柯里化函数 bit1129 scala
本篇文章重点说明什么是函数柯里化，这个语法现象的背后动机是什么，有什么样的应用场景，以及与部分应用函数(Partial Applied Function)之间的联系 1. 什么是柯里化函数 A way to write functions with multiple parameter lists. For instance def f(x: Int)(y: Int) is a
HashMap dalan_123 java
HashMap在java中对很多人来说都是熟的；基于hash表的map接口的非同步实现。允许使用null和null键；同时不能保证元素的顺序；也就是从来都不保证其中的元素的顺序恒久不变。 1、数据结构在java中，最基本的数据结构无外乎：数组和引用（指针），所有的数据结构都可以用这两个来构造，HashMap也不例外，归根到底HashMap就是一个链表散列的数据
Java Swing如何实时刷新JTextArea，以显示刚才加append的内容周凡杨 java 更新 swing JTextArea
在代码中执行完textArea.append("message")后，如果你想让这个更新立刻显示在界面上而不是等swing的主线程返回后刷新，我们一般会在该语句后调用textArea.invalidate()和textArea.repaint()。问题是这个方法并不能有任何效果，textArea的内容没有任何变化，这或许是swing的一个bug，有一个笨拙的办法可以实现
servlet或struts的Action处理ajax请求 g21121 servlet
其实处理ajax的请求非常简单，直接看代码就行了： //如果用的是struts //HttpServletResponse response = ServletActionContext.getResponse(); // 设置输出为文字流 response.setContentType("text/plain"); // 设置字符集 res
FineReport的公式编辑框的语法简介老A不折腾 finereport 公式总结
FINEREPORT用到公式的地方非常多，单元格（以=开头的便被解析为公式），条件显示，数据字典，报表填报属性值定义，图表标题，轴定义，页眉页脚，甚至单元格的其他属性中的鼠标悬浮提示内容都可以写公式。简单的说下自己感觉的公式要注意的几个地方： 1.if语句语法刚接触感觉比较奇怪，if(条件式子,值1,值2)，if可以嵌套，if(条件式子1，值1，if(条件式子2，值2，值3)
linux mysql 数据库乱码的解决办法墙头上一根草 linux mysql 数据库乱码
linux 上mysql数据库区分大小写的配置 lower_case_table_names=1 1-不区分大小写 0-区分大小写修改/etc/my.cnf 具体的修改内容如下: [client] default-character-set=utf8 [mysqld] datadir=/var/lib/mysql socket=/va
我的spring学习笔记6-ApplicationContext实例化的参数兼容思想 aijuans Spring 3
ApplicationContext能读取多个Bean定义文件，方法是： ApplicationContext appContext = new ClassPathXmlApplicationContext（ new String[]｛“bean-config1.xml”，“bean-config2.xml”，“bean-config3.xml”，“bean-config4.xml
mysql 基准测试之sysbench annan211 基准测试 mysql基准测试 MySQL测试 sysbench
1 执行如下命令，安装sysbench-0.5： tar xzvf sysbench-0.5.tar.gz cd sysbench-0.5 chmod +x autogen.sh ./autogen.sh ./configure --with-mysql --with-mysql-includes=/usr/local/mysql
sql的复杂查询使用案列与技巧百合不是茶 oracle sql 函数数据分页合并查询
本片博客使用的数据库表是oracle中的scott用户表; ------------------- 自然连接查询查询 smith 的上司(两种方法) &
深入学习Thread类 bijian1013 java thread 多线程 java多线程
一．线程的名字下面来看一下Thread类的name属性，它的类型是String。它其实就是线程的名字。在Thread类中，有String getName()和void setName(String)两个方法用来设置和获取这个属性的值。同时，Thr
JSON串转换成Map以及如何转换到对应的数据类型 bijian1013 java fastjson net.sf.json
在实际开发中，难免会碰到JSON串转换成Map的情况，下面来看看这方面的实例。另外，由于fastjson只支持JDK1.5及以上版本，因此在JDK1.4的项目中可以采用net.sf.json来处理。一.fastjson实例 JsonUtil.java package com.study; impor
【RPC框架HttpInvoker一】HttpInvoker：Spring自带RPC框架 bit1129 spring
HttpInvoker是Spring原生的RPC调用框架，HttpInvoker同Burlap和Hessian一样，提供了一致的服务Exporter以及客户端的服务代理工厂Bean，这篇文章主要是复制粘贴了Hessian与Spring集成一文，【RPC框架Hessian四】Hessian与Spring集成在【RPC框架Hessian二】Hessian 对象序列化和反序列化一文中
【Mahout二】基于Mahout CBayes算法的20newsgroup的脚本分析 bit1129 Mahout
#!/bin/bash # # Licensed to the Apache Software Foundation (ASF) under one or more # contributor license agreements. See the NOTICE file distributed with # this work for additional information re
nginx三种获取用户真实ip的方法 ronin47
随着nginx的迅速崛起，越来越多公司将apache更换成nginx. 同时也越来越多人使用nginx作为负载均衡, 并且代理前面可能还加上了CDN加速，但是随之也遇到一个问题：nginx如何获取用户的真实IP地址,如果后端是apache,请跳转到<apache获取用户真实IP地址>，如果是后端真实服务器是nginx，那么继续往下看。实例环境：用户IP 120.22.11.11
java-判断二叉树是不是平衡 bylijinnan java
参考了 http://zhedahht.blog.163.com/blog/static/25411174201142733927831/ 但是用java来实现有一个问题。由于Java无法像C那样“传递参数的地址，函数返回时能得到参数的值”，唯有新建一个辅助类：AuxClass import ljn.help.*; public class BalancedBTree {
BeanUtils.copyProperties VS PropertyUtils.copyProperties 诸葛不亮 PropertyUtils BeanUtils
BeanUtils.copyProperties VS PropertyUtils.copyProperties 作为两个bean属性copy的工具类，他们被广泛使用，同时也很容易误用，给人造成困然；比如：昨天发现同事在使用BeanUtils.copyProperties copy有integer类型属性的bean时，没有考虑到会将null转换为0，而后面的业
[金融与信息安全]最简单的数据结构最安全 comsci 数据结构
现在最流行的数据库的数据存储文件都具有复杂的文件头格式，用操作系统的记事本软件是无法正常浏览的，这样的情况会有什么问题呢？从信息安全的角度来看，如果我们数据库系统仅仅把这种格式的数据文件做异地备份，如果相同版本的所有数据库管理系统都同时被攻击，那么
vi区段删除 Cwind linux vi 区段删除
区段删除是编辑和分析一些冗长的配置文件或日志文件时比较常用的操作。简记下vi区段删除要点备忘。 vi概述引文中并未将末行模式单独列为一种模式。单不单列并不重要，能区分命令模式与末行模式即可。 vi区段删除步骤： 1. 在末行模式下使用:set nu显示行号非必须，随光标移动vi右下角也会显示行号，能够正确找到并记录删除开始行
清除tomcat缓存的方法总结 dashuaifu tomcat 缓存
用tomcat容器，大家可能会发现这样的问题，修改jsp文件后，但用IE打开依然是以前的Jsp的页面。出现这种现象的原因主要是tomcat缓存的原因。解决办法如下: 在jsp文件头加上 <meta http-equiv="Expires" content="0"> <meta http-equiv="kiben&qu
不要盲目的在项目中使用LESS CSS dcj3sjt126com Web less
　如果你还不知道LESS CSS是什么东西，可以看一下这篇文章，是我一朋友写给新人看的《CSS——LESS》　　不可否认，LESS CSS是个强大的工具，它弥补了css没有变量、无法运算等一些“先天缺陷”，但它似乎给我一种错觉，就是为了功能而实现功能。　　比如它的引用功能 ? .rounded_corners{
[入门]更上一层楼 dcj3sjt126com PHP yii2
更上一层楼通篇阅读完整个“入门”部分，你就完成了一个完整 Yii 应用的创建。在此过程中你学到了如何实现一些常用功能，例如通过 HTML 表单从用户那获取数据，从数据库中获取数据并以分页形式显示。你还学到了如何通过 Gii 去自动生成代码。使用 Gii 生成代码把 Web 开发中多数繁杂的过程转化为仅仅填写几个表单就行。本章将介绍一些有助于更好使用 Yii 的资源：
Apache HttpClient使用详解 eksliang httpclient http协议
Http协议的重要性相信不用我多说了，HttpClient相比传统JDK自带的URLConnection，增加了易用性和灵活性（具体区别，日后我们再讨论），它不仅是客户端发送Http请求变得容易，而且也方便了开发人员测试接口（基于Http协议的），即提高了开发的效率，也方便提高代码的健壮性。因此熟练掌握HttpClient是很重要的必修内容，掌握HttpClient后，相信对于Http协议的了解会
zxing二维码扫描功能 gundumw100 android zxing
经常要用到二维码扫描功能现给出示例代码 import com.google.zxing.WriterException; import com.zxing.activity.CaptureActivity; import com.zxing.encoding.EncodingHandler; import android.app.Activity; import an
纯HTML+CSS带说明的黄色导航菜单 ini html Web html5 css hovertree
HoverTree带说明的CSS菜单:纯HTML+CSS结构链接带说明的黄色导航在线体验效果：http://hovertree.com/texiao/css/1.htm代码如下,保存到HTML文件可以看到效果： <!DOCTYPE html > <html > <head> <title>HoverTree
fastjson初始化对性能的影响 kane_xie fastjson 序列化
之前在项目中序列化是用thrift，性能一般，而且需要用编译器生成新的类，在序列化和反序列化的时候感觉很繁琐，因此想转到json阵营。对比了jackson，gson等框架之后，决定用fastjson，为什么呢，因为看名字感觉很快。。。网上的说法： fastjson 是一个性能很好的 Java 语言实现的 JSON 解析器和生成器，来自阿里巴巴的工程师开发。
基于Mybatis封装的增删改查实现通用自动化sql mengqingyu DAO
1.基于map或javaBean的增删改查可实现不写dao接口和实现类以及xml，有效的提高开发速度。 2.支持自定义注解包括主键生成、列重复验证、列名、表名等 3.支持批量插入、批量更新、批量删除 <bean id="dynamicSqlSessionTemplate" class="com.mqy.mybatis.support.Dynamic
js控制input输入框的方法封装(数字，中文，字母，浮点数等) qifeifei javascript js
在项目开发的时候，经常有一些输入框，控制输入的格式，而不是等输入好了再去检查格式，格式错了就报错，体验不好。 /** 数字，中文，字母,浮点数(+/-/.) 类型输入限制，只要在input标签上加上 jInput="number,chinese,alphabet,floating" 备注：floating属性只能单独用*/ funct
java 计时器应用 tangqi609567707 java timer
mport java.util.TimerTask; import java.util.Calendar; public class MyTask extends TimerTask { private static final int
erlang输出调用栈信息 wudixiaotie erlang
在erlang otp的开发中，如果调用第三方的应用，会有有些错误会不打印栈信息，因为有可能第三方应用会catch然后输出自己的错误信息，所以对排查bug有很大的阻碍，这样就要求我们自己打印调用的栈信息。用这个函数：erlang:process_display (self (), backtrace).需要注意这个函数只会输出到标准错误输出。也可以用这个函数：erlang:get_s