旋转的油纸伞

【论文精读CVPR_2022】High-resolution Face Swapping via Latent Semantics Disentanglement

0、前言
Abstract
1. Introduction
2. Related Work
- 2.1 Face Swapping.
- 2.2 Generative Prior.
3. Method
- 3.1. Overview
- 3.2. Class-Specific Attributes Transfer
- 3.3. Background Transfer
- 3.4. Loss Functions
- - 3.4.1 Adversarial loss.
  - 3.4.2 Identity-preservation loss.
  - 3.4.3 Landmark-alignment Loss.
  - 3.4.4 Reconstruction Loss.
  - 3.4.5 Style-transfer Loss.
  - 3.4.6 Final Objective.
- 3.5. Video Face Swapping
- - 3.5.1 Code Trajectory Constraint.
  - 3.5.2 Flow Trajectory Constraint.
4. Experiments
- 4.1. Implementation Details
- 4.2. Datasets
- 4.3. Comparison on CelebA-HQ Dataset
- - 4.3.1 Qualitative Comparison.
  - 4.3.2 Quantitative Comparison.
- 4.4. Comparison on FaceForensics++ Dataset
- 4.5. Ablation Study
- 4.6. Face Swapping on High-resolution Videos
5. Conclusion and Discussions
- 5.1 Limitations.
- 5.2 Potential Negative Impact.
个人思考与总结

0、前言

Yangyang Xu, Bailin Deng, Junle Wang, Yanqing Jing, Jia Pan, Shengfeng He
论文地址：https://arxiv.org/abs/2203.15958
GitHub地址：https://github.com/cnnlstm/fslsd_hires

整个方法的Pipeline：

首先：我们有源面 $x_s$ 和目标面 $x_t$ 输入预训练的 pSp 编码器，反转获得它们的 $W +$ 潜在码 $w_s = (g_s,h_s)$ 和 $w_t=(g_t,h_t)$ ，其中 $g_s,g_t$ 为结构部分， $h_s,h_t$ 为外观部分。（这里选前7个向量作为结构部分，其余为外观部分）
其次：将源面 $x_s$ 和目标面 $x_t$ 输入需要训练的landmark encoder即 $E_{le}(\cdot,\cdot)$ ，得到源地标 $l_{s}$ 和目标地标 $l_{t}$ ，从而通过 $\overrightarrow{{n}} = E_{le}(l_{s},l_{t})$ 得到 $\overrightarrow{{n}}$ (structure transfer latent direction)。然后通过改变源脸的结构部分潜码获得结果脸的结构潜码 $\widehat{g}_{s} = {g}_{s} + \overrightarrow{{n}}$ ，外观部分直接用目标脸的。故得到最终的结果脸潜码： $\widehat{w}_{s} = Cat(\widehat{g}_{s},{h}_{t})$ 。其输入StyleGAN生成器，即可获得side-output swapped face $y_{s}$ 。
再者： $y_{s}$ 无法保证保留目标脸的背景属性，故这里只保留了其StyleGAN生成器的每个上采样块产生的特征 $F_s = \{f^0_s,f^1_s,...f^N_s\}$ ，然后将目标面 $x_t$ 输入一个编码器 $E_t$ 也得到对应的特征 $F_t = \{f^0_t,f^1_s,...f^N_s\}$ ，其中 $f^ i_t$ 与 $f^i_s$ 具有相同的维度，表示相同分辨率下目标人脸图像的细节。最后我们只需将每个 $f^ i_t$ 的内脸区域通过一个mask替换为 $f^i_s$ 的内脸区域即可。最终输出为 $y_{f} = Dec(F_t,F_s,m_t)$
然后：损失函数包括最终人脸 $y_{f}$ 与目标脸 $x_t$ 的对抗损失，常规的身份损失，对齐 $y_{s}$ , $y_{f}$ 和 $x_{t}$ 的地标对齐损失，常规的重建损失（当 $x_s = x_t$ 时惩罚 $y_s、y_f$ 和 $x_t$ 之间的偏差），风格迁移损失（为外观属性迁移提供更强的指导）。
最后：这篇文章的还一个贡献是对于视频人脸交换的，其对潜在空间(限制结构潜码的变化)和图像空间(限制图像内容变化)施加两个时空约束。如果将换脸方法单独用于视频的每一帧，则会导致相邻帧之间的结果不一致，并导致诸如闪烁之类的伪影，此类伪影在高分辨率下尤为明显。（本文是第一个可行的高分辨率视频换脸方案）

Abstract

1.方法介绍：我们提出了一种新的高分辨率的人脸交换方法使用固有的先验知识inherent prior knowledge的预训练GAN模型。
2. 现有的问题：尽管之前的研究可以利用生成先验generative priors来产生高分辨率的结果，但它们的质量可能会受到潜在空间纠缠语义的影响。
3. 解决方法：我们利用生成器的渐进式特性，明确地解开潜在语义，从浅层导出结构属性，从深层导出外观属性。
通过引入地标驱动的结构转移潜方向，进一步分离了结构属性中的身份和姿态信息。
解纠缠的潜在代码产生丰富的生成特征，结合特征混合来产生合理的交换结果。
4. 视频贡献：我们进一步将我们的方法扩展到视频人脸交换，通过对潜在空间和图像空间施加两个时空约束。
5. 实验：大量实验表明，该方法在幻觉hallucination质量和一致性方面优于目前最先进的图像/视频人脸交换方法。
代码可以在https://github.com/cnnlstm/FSLSD_HiRes找到。

1. Introduction

人脸交换是指将源人脸图像中的身份信息传递到目标人脸图像中，同时保留目标图像中的面部表情、头部姿态、光照和背景等属性。
由于其广泛的潜在应用，如电脑游戏、特效、隐私保护等，受到了计算机视觉和图形界的广泛关注[13,22,41,42]。
【换脸介绍】

人脸交换的主要挑战是识别高度纠缠的目标人脸属性和源身份信息，以实现自然外观的交换。
早期的工作如[8]取代了人脸区域的像素，并依赖于源和目标在姿态和光照方面的相似性。
基于3D的方法[14,28,37]将3D模型拟合到人脸上，可以处理大的姿态变化，但拟合受环境影响较大，因此不稳定。
另一些著作引入了生成对抗网络(generative adversarial networks, GANs)来幻象目标属性[24,26,35]由于其强大的生成能力。
【换脸历史背景】

尽管已经取得了很大的进展，但由于端到端框架的压缩表示[7,26,34]、对抗训练[5]的不稳定性以及GPU内存大小的限制，现有的许多基于GAN的方法在高分辨率人脸上都不能很好地工作。
最近，Zhu等人[55]利用预先训练好的高分辨率GAN模型的固有先验知识，提出了在StyleGAN的潜在空间中进行高分辨率人脸交换的MegaFS[20,21]。
它学习将源图像和目标图像的反向潜码进行组合，并将融合后的代码直接输入StyleGAN生成器生成交换后的结果。
然而，由于身份和属性在潜空间中高度纠缠，在没有明确引导的情况下组装两个潜码并不能同时保证源身份的传递和目标属性的保留。
此外，潜伏码中嵌入的细微细节在组装后容易被稀释，因此，它们交换后的表面往往呈现模糊的外观，一些细微细节缺失(见图1c和图1f为例)。
为了获得潜在空间的语义解纠缠，我们认为人脸特征应该以特定类别的方式转移。
从直观上看，人脸的结构属性(如面部形状、姿势和表情)应该与外观属性(如光照和肤色)区别对待。
交换后的面孔在产生目标图像的外观属性时应保留源身份。
这样的分离处理需要在结构和外观特征之间进行适当的分解。
【端到端框架的压缩表示、对抗训练的不稳定性以及GPU内存大小的限制，现有的许多基于GAN的方法在高分辨率人脸上都不能很好地工作，而MegaFS的身份和属性在潜空间中高度纠缠，这往往使结果呈现模糊的外观与一些细微细节缺失】

本文对StyleGAN的潜在语义进行了研究。
StyleGAN是一个噪声到图像，粗到细的生成过程，我们利用它的渐进式本质来分解交换的关键因素，如姿势，表情和外观。
给定反向的源代码，我们通过推导结构转移潜方向来解耦结构(姿态和表情)属性与身份。
方向是由源和目标地标决定的，并作为一个潜在的空间操作来转移结构。
另一方面，外观属性是在更深的层中控制的。
因此，我们将目标的外观代码与深层结构传递的源代码进行重组。
通过这种方式，集成的潜在代码保留了来自源的身份属性，同时具有目标的外观和结构。
这个解开的潜在代码被输入到StyleGAN生成器，以产生生成特征。
这种丰富的先验知识在所有尺度上与目标特征进行聚合，有效地消除了明显的混合伪影。
【具体操作】

此外，我们将我们的模型扩展到视频人脸交换，其中我们从源人脸图像和目标人脸视频生成交换的人脸视频。
由于将我们的模型直接应用于每个视频帧会导致不连贯伪影，我们对解纠缠结构和外观语义施加了两个时空约束。
首先，我们要求交换面的帧间结构变化与目标面的变化保持一致。
这是通过在浅层(代表结构变化)的潜在偏移方面加强交换和目标面之间的相似性来实现的。
其次，我们对输出视频中相邻帧之间的图像内容变化采用线性假设。
这两个约束有效地保证了框架间的一致性。
在几个人脸交换方法的基准上进行的大量实验表明，与最先进的方法相比，本交换方法具有更好的性能。
据我们所知，这是第一个可行的高分辨率视频换脸方案。
【第一个可行的高分辨率视频换脸方案，施加了两个约束】

综上所述，我们的贡献有三个方面:

我们提出了一个高分辨率换脸的新框架。我们解开了一个预先训练的StyleGAN的潜在语义，使源身份的转移，同时保留目标的外观和结构。
我们定制了两个新的约束来加强交换面视频的一致性，包括一个限制相邻帧潜在码之间偏移量的代码轨迹约束，以及一个在RGB空间工作的流轨迹约束，以保证视频的平滑性。
在多个数据集上的实验展示了我们方法的最新结果，这可能会成为人脸伪造检测的新高分辨率测试用例。

2. Related Work

2.1 Face Swapping.

换脸一直是一个活跃的研究课题。
早期的作品如[8]只能处理相同姿势的主题。
基于3D的方法将3D模板与源和目标人脸相匹配，以更好地处理大的姿态变化[14,28,37]。
Face2Face[45]将双线性人脸模型与源人脸和目标人脸进行匹配，以传递表情，并通过额外的步骤合成逼真的嘴型。
然而，基于3D的方法不能处理像照明和样式这样的外观属性。
最近，许多作品都引入了用于换脸的GANs。
RSGAN[35]处理潜在空间中的面部和头发区域，并通过替换潜在表征进行交换。
同样，FSNet[34]对人脸区域和非人脸区域进行编码，形成不同的潜码。
FSGAN[36]同时进行人脸再现和交换。
最近，Faceshifter[26]分别对源身份和目标属性进行编码。
但由于对抗训练的不稳定，端到端框架的压缩表示等原因，它们都无法在高分辨率下交换人脸。最近，Naruniec等人的[33]交换人脸具有较高的分辨率，但他们的模型是特定于受试者的。
MegaFS[55]利用了预先训练的StyleGAN的先验知识[20,21]。
该算法将源和目标的人脸反转到潜伏空间，然后设计人脸转移块来组装潜伏码。
然而，身份和属性在潜在空间中纠缠不清，在没有明确引导的情况下组装两个潜在码是不够的。
相反，我们建议以一种特定于类的方式来传递属性。
【说明了现有方法的不足：基于3D的方法不能处理像照明和样式这样的外观属性，由于对抗训练的不稳定，端到端框架的压缩表示等原因，它们都无法在高分辨率下交换人脸，等】

2.2 Generative Prior.

生成模型在合成高质量图像方面显示出巨大的潜力[10,16,19 - 21]。
研究表明，预训练GAN的潜在空间编码了丰富的语义信息。
因此，许多作品利用生成模型中隐藏的先验知识进行语义编辑、图像翻译、超分辨率等[4、17、39、40、50、52]。
特别是，Gu等人[17]提出了一种GAN反演方法用于图像着色和语义编辑，而其他一些作品[11,31,54]使用预先训练的StyleGAN进行图像超分辨率。
最近，生成先验也被引入换脸。
除了MegaFS[55]外，Nitzan等人的[38]在潜在空间中通过全连接网络将属性从一张脸转移到另一张脸。
与这些工作不同的是，我们将目标属性以一种更详细的方式传递给源脸。
我们将属性分解为结构属性和外观属性，充分利用生成模型的可解性和可编辑性。
【生成先验，就是利用预训练模型StyleGAN】

3. Method

3.1. Overview

给定两幅高分辨率人脸图像，我们的目标是构造一幅包含源人脸 $x_s$ 的身份和目标人脸 $x_t$ 的姿态、表情、光照、背景等属性的人脸图像。
为此，我们首先使用StyleGAN生成器构造一个侧输出交换面，方法是在重用目标的外观属性的同时，在潜在空间中混合源和目标的结构属性(第3.2节)。
为了进一步传递目标人脸的背景，我们使用编码器从目标图像中生成多分辨率特征，并将其与StyleGAN生成器上采样块中的相应特征进行混合。
混合的特征被送入解码器，合成最终交换后的人脸图像(第3.3节)。
图2为我们的管道概述。
使用一组损失函数对网络进行训练，这些函数增强了所需的属性，如源身份和目标外观的保存(第3.4节)。
我们还将我们的方法扩展到视频人脸交换，使用额外的时空约束来加强一致性(第3.5节)。

我们解纠缠的高分辨率面部交换的管道。
我们通过三个模块传输不同级别的属性。
我们首先通过 pSp 编码器将源面和目标面都反转到预训练 StyleGAN $G$ 的 $W +$ 潜在空间，然后通过对源和目标地标进行编码来学习结构转移方向。
外观属性通过交换两个潜在代码的后半部分来传递。
为了消除混合边界，目标特征以多尺度方式与生成特征聚合。

3.2. Class-Specific Attributes Transfer

人脸图像通常包含不同类别的属性。
例如，姿势和表情与面部结构有关，而灯光和颜色与外观有关。
以前的人脸交换技术，如FaceShifter[26]和MegaFS[55]，在将属性转换到输出图像时，并没有明确区分不同类型的属性。
相反，我们认为，将结构和外观属性分开传递是有益的:
输出的结构属性可以由源图像和目标图像中的对应属性共同确定，以获得与目标人脸相同的姿态和表情，同时保留源人脸的身份。
同时，目标人脸的外观属性可以直接重用，在输出中实现相似的人脸外观。
【将属性分类传递】

为此，我们注意到最先进的生成模型 StyleGAN[20, 21]为此类分离处理提供了合适的表示。
特别是，要使用 StyleGAN 生成器，通常的做法是在扩展的潜在空间 $W +$ 中编码图像，其中潜在代码由多个高维向量组成，每个对应于 StyleGAN 的每个输入层[3, 40]。
正如 [40, 51]中所述，StyleGAN 的不同输入层对应不同级别的细节。
因此，我们将对应于浅层的潜在代码的前 $K$ 个向量视为结构属性的编码。
对应于更深层的其余向量用于外观。
对于 $1024 \times 1024$ 图像，潜在代码由 18 个不同的 512 维向量组成，我们遵循[40]并选择前 7 个向量作为结构部分。
通过这种分离，可以分别传输潜代码的结构部分和外观部分。
具体来说，我们首先使用预训练的 pSp 编码器[40]反转源面 $x_s$ 和目标面 $x_t$ 以获得它们的 $W +$ 潜在代码 $w_s = (g_s,h_s)$ 和 $w_t=(g_t,h_t)$ ，其中 $g_s,g_t$ 为结构部分， $h_s,h_t$ 为外观部分。
为了构建具有与目标的姿势和表情相同的源身份的交换面的结构属性，我们注意到它们应该从源结构属性获得，考虑到源和目标之间的姿势和表情差异并进行修改。
因此，我们通过应用从源结构和目标结构获得的结构转移潜在方向 $\overrightarrow{{n}}$ 来计算交换面的潜在代码的结构部分 $\widehat{g}_s$ ：
$\begin{equation} \widehat{g}_{s} = {g}_{s} + \overrightarrow{{n}}. \end{equation}$ 为了推导 $\overrightarrow{{n}}$ ，我们注意到面部结构可以由面部标志指示。
因此，我们训练了一个地标编码器 $E_{le}(\cdot,\cdot)$ ，它从源地标 $l_{s}$ 和目标地标 $l_{t}$ 的热图编码生成 $\overrightarrow{{n}}$ ：
$\overrightarrow{{n}} = E_{le}(l_{s},l_{t}).$ 为了将目标人脸的外观属性转移到交换后的人脸，我们直接重用目标潜在代码的外观部分 $h_t$ 。
然后它与 $\widehat{g}_{s}$ 重新整合，形成交换面的潜在代码：
$\begin{equation} \widehat{w}_{s} = Cat(\widehat{g}_{s},{h}_{t}), \end{equation}$ 其中 $Cat(\cdot,\cdot)$ 表示串联运算符。
该代码被输入到预训练的 StyleGAN 生成器中，以获得侧输出side-output交换面 $y_{s}$ 。
【分离latent codes为结构部分和外观部分，结构部分由源脸修改而来，外观部分直接用目标脸的】

3.3. Background Transfer

对于人脸交换应用，目标人脸的背景也需要保留在输出图像中。
对于在 Sec.3.2中计算的交换面 $y_s$ ，这通常不能得到保证。
一种常见的解决方案是应用泊松混合作为后处理，将交换的内面与目标图像混合。
然而，这会导致内面部边界周围出现不自然的外观。
【背景处理】

为了解决这个问题，我们丢弃了侧输出面 $y_s$ ，但保留了 StyleGAN生成器来自公式(2)的潜在代码 $\widehat{w}_{s}$ 的每个上采样块产生的特征 $F_s = \{f^0_s,f^1_s,...f^N_s\}$ 。
我们注意到 $F_s$ 可以被视为来自侧面输出面部图像的不同细节级别的表示。
因此，我们将编码器 $E_t$ 应用于目标面 $x_t$ ，使其层生成相应的特征 $F_t = \{f^0_t,f^1_s,...f^N_s\}$ ，其中 $f^ i_t$ 与 $f^i_s$ 具有相同的维度，表示相同分辨率下目标人脸图像的细节。
然后，我们通过将内脸区域的 $f^i_t$ 的组件替换为 $f^i_s$ 中的对应特征来聚合每对对应的特征 $(f^i_s, f^i_t)$ 。
所有聚合的特征都被送入解码器以产生最终的人脸图像 $y_f$ ，它可以写成：
$y_{f} = Dec(F_t,F_s,m_t),$ 其中 $Dec(\cdot,\cdot,\cdot)$ 表示解码器， $m_t$ 是目标人脸图像的内面具。
通过这种方式，解码器在多级特征中传输背景，这不仅消除了显式背景混合的需要，而且使代码 $\widehat{w}_{s}$ 能够专注于面部区域并促进属性转移。
【通过提取side-output swapped face和目标脸的对应特征，以及目标脸mask进行属性的保留，操作是保留侧交换脸的脸部区域，其他用目标脸的。】

3.4. Loss Functions

我们定制了几个应用于侧输出交换面 $y_{s}$ 或最终面 $y_{f}$ 的损失，以实现高效的属性传输，如下所述。
我们还在最终输出上引入了风格保留损失，以缩小交换后的风格与目标之间的风格差距。

3.4.1 Adversarial loss.

我们利用对抗性损失来实现最终交换面孔和真实面孔之间的分布对齐。
特别是，我们将最终人脸 $y_{f}$ 与目标人脸对齐，损失如下：
$\begin{equation*} {L}_{adv} = \underset{y_{f} \sim P_{Y_{f}}}{\mathbb{E}} [-\log( D_{f}(y_{f}))], \end{equation*}$ 其中 $P_{Y_{f}}$ 表示最终人脸的分布。
将最终人脸与真实目标人脸 $x_t$ 区分开来的鉴别器 $D_{f}$ 是用损失训练的
$\begin{equation*} {L}_{D_{f}} = \underset{y_{f} \sim P_{Y_{f}}}{\mathbb{E}} [-\log( 1- D_{f}(y_{f})] + \underset{x_t \sim P_{X_t}}{\mathbb{E}} [-\log(D_{f}(x_t)] , \end{equation*}$ 其中 $P_{X_{t}}$ 表示真实面孔的分布。

3.4.2 Identity-preservation loss.

为了保留源人脸的身份，我们为最终人脸 $y_f$ 和源人脸 $x_s$ 引入身份保留损失：
$\begin{equation*} {L}_{id} = 1 - \texttt{cos}(\Phi_{id}(y_f),\Phi_{id}(x_s)), \end{equation*}$ 其中 $\Phi_{id}(\cdot)$ 是人脸识别的预训练ArcFace网络[15]， $\texttt{cos}(\cdot, \cdot)$ 表示余弦相似度。

3.4.3 Landmark-alignment Loss.

由于我们使用面部标志来表示结构属性，因此我们引入以下损失来对齐侧输出交换面 $y_s$ 、最终面部 $y_f$ 和目标面部 $x_t$ 的标志：
$\begin{equation*} {L}_{lmk} = \|E_{lmk}(y_s)-E_{lmk}(x_t)\|_2 + \|E_{lmk}(y_f)-E_{lmk}(x_t)\|_2, \end{equation*}$ 其中 $E_{lmk}(\cdot)$ 是预训练的地标估计器[47]和 $\|\cdot\|_2$ 表示 $\ell_2$ 范数。

3.4.4 Reconstruction Loss.

直观地说，如果源面 $x_s$ 和目标面 $x_t$ 是同一幅图像，网络应该为侧输出交换面 $y_s$ 和最终面 $y_f$ 重建该图像。
因此，我们遵循 pSp[40]并使用像素相似度和感知相似度来定义重建损失，当 $x_s = x_t$ 时惩罚 $y_s、y_f$ 和 $x_t$ 之间的偏差：
$\begin{align*} &{L}_{rec} = \nonumber\\ & \begin{cases} \|y_f - x_t\|_2 + \alpha \|F(y_f) - F(x_t)\|_2 & \\ ~ + \|y_s - x_t\|_2 + \alpha \|F(y_s) - F(x_t)\|_2, & \text{if}~x_s = x_t,\\ 0, &{\text{otherwise}}, \end{cases} \end{align*}$ 其中 $F(\cdot)$ 是感知特征提取器， $\alpha$ 是平衡像素相似度和感知相似度项的权重。
我们在实验中设置 $\alpha=0.8$ 。

3.4.5 Style-transfer Loss.

正如在 Sec.3.2中提到的，我们在潜在空间中传输外观属性。
但是，如果源人脸和目标人脸的风格差异太大，简单的潜在代码替换可能无法有效减少风格差异。
受 BeautyGAN[27]的启发，我们通过直方图映射创建一个引导人脸图像 $\mathrm{HM}(y_f,x_t)$ ，并通过以下损失将最终人脸 $y_f$ 与引导人脸对齐：
$\begin{equation*} {L}_{st} = \|y_f - \mathrm{HM}(y_f,x_t) \|_2. \end{equation*}$ 与简单的潜在代码替换相比，这为外观属性迁移提供了更强的指导。
【通过损失函数加强外观属性迁移，看看消融实验？】

3.4.6 Final Objective.

训练我们模型的最终损失函数是上述损失的加权组合：
$\begin{equation} {L}_{total} = \lambda_1 {L}_{adv} + \lambda_2 {L}_{id} + \lambda_3 {L}_{lmk} + \lambda_4 {L}_{rec} + \lambda_5 {L}_{st}, \end{equation}$ 其中 $\lambda_1, \lambda_2, \lambda_3, \lambda_4, \lambda_5$ 是损失项的权重。

3.5. Video Face Swapping

我们的方法可以扩展到视频换脸。
给定一个源人脸 $x_s$ 和一系列具有 $M$ 个连续帧的目标人脸 $S_t=\{x_{t}^0,x_{t}^1,...,x_{t}^{M- 1}\}$ ，我们想得到一个交换后的人脸序列 $Y=\{y^0,y^1,...,y^{M-1}\}$ 。
大多数现有作品将基于图像的人脸交换方法分别应用于每个视频帧，这会导致相邻帧之间的结果不一致，并导致诸如闪烁之类的伪影。此类伪影在高分辨率下尤为明显。
为了解决这个问题，我们需要在结构和外观方面强制相邻帧之间的一致性，以便这些属性在帧之间平滑变化。
现有的时间一致性工作[9, 25]只考虑了外观一致性，不能直接用于换脸。
我们分别为潜在空间和图像空间提出了两个时空约束，以实现结构和外观的一致性。
【潜在空间和图像空间的两个时空约束，以实现不同视频帧之间结构和外观的一致性。】

3.5.1 Code Trajectory Constraint.

由于目标帧的结构属性变化平稳，我们可以通过要求它们在结构属性上具有与目标相似的变化来强制交换面部帧的结构一致性。
为此，我们注意到两个相邻帧中潜在代码的结构部分之间的偏移可以被视为结构属性变化的指示。
因此，我们使用以下损失来来增强目标视频和输出视频在潜空间中结构码的相似轨迹:
$\begin{equation*} {L}_{ct} = \sum\nolimits_{k=1}^{M} \left\|(\widehat{g}_{s}^{k} - \widehat{g}_s^{k-1}) - ({g}_{t}^{k} - {g}_t^{k-1})\right\|_2, \end{equation*}$ 其中 ${g}_{t}^k$ 表示目标框架 $x_{t}^k$ 的潜在代码的结构部分， $\widehat{g}_{s}^{k}$ 表示使用 Eq.(1)从 $x_{s}$ 和 $x_{t}^k$ 获得的交换面的结构代码。
【用潜在代码的结构属性部分约束相邻帧之间的变化】

3.5.2 Flow Trajectory Constraint.

对于外观一致性，我们遵循局部线性模型[30, 32]假设相邻帧之间变化均匀¹。
具体来说，我们将交换后的人脸序列中从帧 $y_f^{i}$ 到附近帧 $y_f^{j}$ 的光流表示为：

$\begin{equation*} f_{i \Rightarrow j} = \Phi(y_f^{i},y_f^{j}), \end{equation*}$ 其中 $\Phi(\cdot,\cdot)$ 是预训练的 PWC-Net[44]用于流量预测。
从局部线性假设来看，交换后的人脸序列中两个相邻帧之间的密集对应关系可以通过在两帧之间插值前向流和后向流来近似，这会导致以下损失：
$\begin{equation*} {L}_{ft} = \sum\nolimits_{k} \| (f_{k \Rightarrow k+2} + f_{k+2 \Rightarrow k})/2 - f_{k \Rightarrow k+1} \|_2. \end{equation*}$ 我们注意到 ${L}_{ft}$ 实际上是光流的时间拉普拉斯算子的 $\ell_1/\ell_2$ 范数。
这促进了在大多数帧上具有小拉普拉斯算子的序列，同时允许在某些帧上具有大拉普拉斯算子[6]，这允许在时间上分段平滑的运动序列。
【外观一致性约束】

4. Experiments

4.1. Implementation Details

我们利用在分辨率为 $1024\times 1024$ 的FFHQ 数据集[20]上预训练的 StyleGAN2 生成器[21]。
pSp 编码器也在该数据集上进行了预训练。
我们使用 pSp 的修改作为我们的地标（结构的更多细节可以在补充材料中看到）。
我们使用 Adam 优化器[23]以 $\times 10^{-4}$ 的学习率训练模型， $1_{st}$ 和 $2_{nd}$ moment 估计的指数衰减率分别为 ${\beta}_1 = 0.9$ 和 ${\beta}_2 = 0.999$ ，以及 ${\epsilon} = 1 \times 10^{-8}$ 。
批量大小设置为 8，模型经过 500,000 次迭代训练。
我们根据经验将 Eq.(3) 中的权重设置为 $\lambda_{1}=1$ , $\lambda_{2}=2$ , $\lambda_{3}=0.1$ , $\lambda_{4 }=2$ 和 $\lambda_{5}=0.2$ 。
我们使用四个 Tesla V100 GPU 在 Pytorch 中实现我们的方法。
训练整个模型大约需要两天时间。
【实验设置细节】

4.2. Datasets

Datasets. 我们在以下三个数据集上评估我们的模型：（应该是两个）

CelebA-HQ 包含 30,000 张名人面孔，分辨率为 $1024$ $\times$ $1024$ [19]。由于质量上乘，在很多人脸编辑作品中得到了广泛的应用。
FaceForensics++ 包含从 YouTube 下载的 1,000 个原始谈话视频，并使用 5 种换脸方法进行操作[42]。该数据集可作为许多换脸作品的基准。

Evaluation Metrics. 我们在定量实验中使用了几个指标。 ID retrieval rate，用基于余弦相似度的top-1身份匹配率衡量，表示身份保存能力。
对于一些实验，我们遵循 MegaFS[55]并计算ID similarity，这是使用 CosFace[46]交换的人脸与其对应源之间的余弦相似度，以降低计算成本。
The pose error and the expression error分别是姿势和表情特征向量之间的 $\ell_2$ 距离，分别使用预训练的估计器[12,43]在交换和目标面上，这表示传递结构属性的能力。
The Fr $\'{e}$ chet Inception Distance (FID) [18]计算真实人脸和交换图像分布之间的 Wasserstein-2 距离，它衡量交换人脸的图像质量。

4.3. Comparison on CelebA-HQ Dataset

4.3.1 Qualitative Comparison.

我们首先在高分辨率 CelebA-HQ 数据集[19]上进行实验。
我们将我们的方法与以 $1024$ $\times$ $1024$ 分辨率交换人脸的 MegaFS[55] 进行比较，定性比较结果如图3所示。
我们可以看到 MegaFS 生成的人脸往往具有模糊的外观，没有生动的细节。
这是因为他们只对低维潜在代码执行面部交换而没有明确的分离，这很容易稀释细节的潜在编码。
【MegaFS 生成的人脸往往具有模糊的外观，没有生动的细节。】

此外，在他们的结果中，面部区域和背景之间存在明显的界限。
相比之下，我们的方法利用来自 StyleGAN 生成器的多分辨率空间特征并将它们与来自目标解码器的背景特征聚合，这有助于保留高质量的面部细节。
此外，MegaFS 没有将目标属性有效地传输到输出，尤其是当源和目标之间存在较大的语义差距时。
例如，在 Fig.3的第二行中，MegaFS 无法从目标传输照明或样式，因为这些属性在源和目标之间存在很大差异。
相比之下，由于我们解开的属性转移，我们的结果更有效地保持了目标属性。
对于图3第四行左侧的结果，我们还可以看到 MegaFS 没有保留源身份，与源相比错误地放大了眼睛。
这是因为身份和属性在潜在空间中高度纠缠，而 MegaFS 中缺乏显式解纠缠会导致不令人满意的结果。
相反，我们分别传输不同级别的属性，这有助于维护源身份和目标属性。
【细粒度分析MegaFS的缺点】

定性比较换脸对1024×1024的分辨率。我们可以看到MegaFS总是将模糊的人脸与背景呈现出明显的边界。此外，它们不能在交换过程中有效地保存源身份。同时，当源和目标之间的外观属性较大时，无法将目标传递到输出中。相反，我们的方法可以在保持身份不变的情况下，按照需要传递结构和外观属性。放大看最好的景色。

4.3.2 Quantitative Comparison.

我们还对 CelebA-HQ 数据集进行了定量比较。
我们遵循 MegaFS 并在 300,000 个交换面孔上进行比较以进行公平比较。
Tab.1显示了每种方法的评估指标的平均值。
我们的方法在身份保存和属性转移方面都具有更强的能力。
此外，我们的结果具有较低的 FID，这表明我们交换的面孔比 MegaFS 的面孔更真实。
【定量比较都好】

4.4. Comparison on FaceForensics++ Dataset

为了与其他只能应用于低分辨率图像的换脸方法进行比较，我们进一步在 Face-Forensics++ 数据集上评估我们的方法。
Fig.4给出了与 MegaFS 以及三种基于非 GAN 先验和低分辨率方法的定性比较结果：FaceSwap[2]、Deepfakes[1]和 FaceShifter[26]。
我们可以看到，FaceSwap 和 MegaFS 会导致明显的混合边界或伪影，而我们的方法可以消除它们，因为我们的背景传输。
然而，我们的交换结果的质量不如 Fig.3中的高分辨率面部交换那么高。
这可能是由于领域差距：我们方法中使用的 styleGAN 生成器和 pSp 编码器都在高分辨率数据上进行了预训练，而来自 FaceForensics++ 的大部分数据的分辨率较低。
低分辨率和高分辨率数据集之间的大域差距可能会降低我们方法的性能。
【低分辨率数据集比较】

我们还对该数据集进行定量评估。
特别是，我们遵循 MegaFS[55]从每个视频中均匀采样 10 帧，然后由 MTCNN[53]进行处理。
在过滤掉重复的身份后，我们得到了 885 个视频，总共 88500 帧。
Tab.2显示了不同方法的评估指标的平均值。
我们可以看到我们的方法更有效地保留了目标姿势和表情，这要归功于我们的结构属性传输将地标作为输入并为最终交换的人脸提供强大的指导信号。
同时，我们的模型在 ID 检索率方面低于 FaceShifter 和 MegaFS。
我们推测这是由于如上所述的低分辨率图像和高分辨率图像之间的域差距，这使得我们的反演模型在保留低分辨率图像的身份信息方面效果较差。
【低分辨率身份保存效果较差】

4.5. Ablation Study

在本节中，我们执行消融研究并使用 CelebA-HQ 数据集来评估我们的分离方法在传输属性方面的有效性。
我们使用 MegaFS 作为基线，因为它们仅在两个潜在代码上交换面孔，而没有分离属性。
我们进一步包括了我们方法的三个变体，并对模块和损失函数进行了修改。
对于第一个变体 (Var.1)，我们保持源代码 $w_s$ 的外观部分不变以生成侧输出面，并丢弃样式转移损失和外观转移的潜在代码交换操作，即没有明确的转移指导有助于外观属性。
对于第二个变体 (Var.2)，我们丢弃了背景传输模块，直接将侧输出人脸与目标人脸图像混合作为最终输出。
不同变体与基线之间的定性比较如图5所示。
我们可以看到 MegaFS 基线导致模糊的面孔和清晰的边界。
如前所述，这是由于潜在代码中高度纠缠的身份和属性，这可能导致传输过程中的信息丢失。
第一个变体呈现了不自然的样式，它验证了我们的外观属性传输的必要性，它在交换过程中提供了明确的外观指导。
由于缺少融合多分辨率特征的背景传输模块，第二个变体在交换的面部区域和背景之间呈现出显着的混合边界（参见 $2_{nd}$ 和 $3_{rd}$ 样本）从源头和目标进行自然融合。
同时，我们的目标编码器-解码器结构也可以容忍源和目标之间的结构差异，并产生最终合理的结果。
由于我们解开的属性转移，我们最终交换的面孔呈现了来自目标的成功语义转移，并且源身份得到了很好的保留。
【这里并没有给出Style-transfer Loss的单独消融实验，而是与结构潜码一起变化的。】

4.6. Face Swapping on High-resolution Videos

Fig.6显示了我们的方法在高分辨率视频上的定性结果。
将我们的方法单独应用于每个帧会导致相邻帧之间的不连贯，而我们的代码和流轨迹约束会大大提高连贯性和视觉质量。

5. Conclusion and Discussions

介绍：我们提出了一种基于预训练的StyleGAN固有先验知识的高分辨率人脸交换方法。
方法：我们将属性分为结构属性和外观属性，并在解纠缠的潜在空间中将它们分别转换。
我们提出了一种landmark 编码器，它可以预测结构属性转移的潜在方向。
将转移的潜码生成的StyleGAN生成特征与目标图像编码器的多分辨率特征进行聚合，传递背景信息，生成高质量的结果。
视频：通过增加两个时空约束，我们进一步将该方法扩展到视频人脸交换。
实验：大量的实验证明了解纠缠属性转移在幻觉质量和一致性方面的优越性。

5.1 Limitations.

由于我们将属性转移到StyleGAN的潜在空间中，所以结果的质量很大程度上依赖于GAN反演方法。
特别是，如果反演没有为源和目标面生成忠实的潜在码，则结果不能保证保持源的身份。
我们的方法将所有目标的外观属性转移到结果图像中，不支持源图像和目标图像的选择性转移。
这种细粒度fine-grained的控制可能对某些应用程序(如内容创建)有益，但需要进一步理清不同类别的外观属性之间的关系。
这可以成为进一步研究的一个途径。
（E4S: Fine-grained Face Swapping via Regional GAN Inversion也许是因此而做的。）

5.2 Potential Negative Impact.

虽然这不是这项工作的目的，但真实的面部交换可能会被误用在深度伪造相关的应用程序中。
通过模型的门控释放和能够识别CNN生成的图像[48]的伪造检测方法，可以降低风险。
此外，我们的方法还可以用于生成新的高分辨率测试用例，用于基准测试和进一步开发伪造检测技术[42]。

个人思考与总结

首先：这篇文章的主要贡献是提出将StyleGAN的潜码进行分离，而不是直接进行融合，即对属性进行了分类。也即是不断的细粒度的进行换脸。
其次：选择性转移，也即可以进行人脸编辑可以参考这篇E4S: Fine-grained Face Swapping via Regional GAN Inversion。
其实也有很多可以改进的地方，例如光照，遮挡，身份等的迁移等。

这里为了简单起见我们遵循局部线性假设，我们也可以遵循加速度感知假设[29, 49]以更好地逼近真实世界的场景运动。 ↩︎

你可能感兴趣的:(CV,计算机视觉,深度学习,人工智能,AI换脸,Face,Swapping)

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
android系统selinux中添加新属性property 辉色投像
1.定位/android/system/sepolicy/private/property_contexts声明属性开头：persist.charge声明属性类型：u:object_r:system_prop:s0图12.定位到android/system/sepolicy/public/domain.te删除neverallow{domain-init}default_prop:property
OC语言多界面传值五大方式 Magnetic_h ios ui 学习 objective-c 开发语言
前言在完成暑假仿写项目时，遇到了许多需要用到多界面传值的地方，这篇博客来总结一下比较常用的五种多界面传值的方式。属性传值属性传值一般用前一个界面向后一个界面传值，简单地说就是通过访问后一个视图控制器的属性来为它赋值，通过这个属性来做到从前一个界面向后一个界面传值。首先在后一个界面中定义属性@interfaceBViewController:UIViewController@propertyNSSt
C语言宏函数南林yan C语言 c语言
一、什么是宏函数？通过宏定义的函数是宏函数。如下，编译器在预处理阶段会将Add(x,y)替换为((x)*(y))#defineAdd(x,y)((x)*(y))#defineAdd(x,y)((x)*(y))intmain(){inta=10;intb=20;intd=10;intc=Add(a+d,b)*2;cout<
理解Gunicorn：Python WSGI服务器的基石范范0825 ipython linux 运维
理解Gunicorn：PythonWSGI服务器的基石介绍Gunicorn，全称GreenUnicorn，是一个为PythonWSGI（WebServerGatewayInterface）应用设计的高效、轻量级HTTP服务器。作为PythonWeb应用部署的常用工具，Gunicorn以其高性能和易用性著称。本文将介绍Gunicorn的基本概念、安装和配置，帮助初学者快速上手。1.什么是Gunico
c++ 的iostream 和 c++的stdio的区别和联系黄卷青灯77 c++算法开发语言 iostream stdio
在C++中，iostream和C语言的stdio.h都是用于处理输入输出的库，但它们在设计、用法和功能上有许多不同。以下是两者的区别和联系：区别1.编程风格iostream（C++风格）：C++标准库中的输入输出流类库，支持面向对象的输入输出操作。典型用法是cin（输入）和cout（输出），使用>操作符来处理数据。更加类型安全，支持用户自定义类型的输入输出。#includeintmain(){in
LocalDateTime 转 String igotyback java 开发语言
importjava.time.LocalDateTime;importjava.time.format.DateTimeFormatter;publicclassMain{publicstaticvoidmain(String[]args){//获取当前时间LocalDateTimenow=LocalDateTime.now();//定义日期格式化器DateTimeFormatterformat
Linux下QT开发的动态库界面弹出操作（SDL2） 13jjyao QT类 qt 开发语言 sdl2 linux
需求：操作系统为linux，开发框架为qt，做成需带界面的qt动态库，调用方为java等非qt程序难点：调用方为java等非qt程序，也就是说调用方肯定不带QApplication::exec()，缺少了这个，QTimer等事件和QT创建的窗口将不能弹出(包括opencv也是不能弹出)；这与qt调用本身qt库是有本质的区别的思路：1.调用方缺QApplication::exec()，那么我们在接口
店群合一模式下的社区团购新发展——结合链动 2+1 模式、AI 智能名片与 S2B2C 商城小程序源码说私域人工智能小程序
摘要：本文探讨了店群合一的社区团购平台在当今商业环境中的重要性和优势。通过分析店群合一模式如何将互联网社群与线下终端紧密结合，阐述了链动2+1模式、AI智能名片和S2B2C商城小程序源码在这一模式中的应用价值。这些创新元素的结合为社区团购带来了新的机遇，提升了用户信任感、拓展了营销渠道，并实现了线上线下的完美融合。一、引言随着互联网技术的不断发展，社区团购作为一种新兴的商业模式，在满足消费者日常需
每日一题——第八十九题互联网打工人no1 C语言程序设计每日一练 c语言
题目：在字符串中找到提取数字，并统计一共找到多少整数，a123xxyu23&8889，那么找到的整数为123，23，8889//思想：#include#include#includeintmain(){charstr[]="a123xxyu23&8889";intcount=0;intnum=0;//用于临时存放当前正在构建的整数。boolinNum=false;//用于标记当前是否正在读取一个整
每日一题——第八十一题互联网打工人no1 C语言程序设计每日一练 c语言
打印如下图案:#includeintmain(){inti,j;charch='A';for(i=1;i<5;i++,ch++){for(j=0;j<5-i;j++){printf("");//控制空格输出}for(j=1;j<2*i;j++)//条件j<2*i{printf("%c",ch);//控制字符输出}printf("\n");}return0;}
每日一题——第八十二题互联网打工人no1 C语言程序设计每日一练 c语言
题目：将一个控制台输入的字符串中的所有元音字母复制到另一字符串中#include#include#include#include#defineMAX_INPUT1024boolisVowel(charp);intmain(){charinput[MAX_INPUT];charoutput[MAX_INPUT];printf("请输入一串字符串：\n");fgets(input,sizeof(inp
每日一题——第八十三题互联网打工人no1 C语言程序设计每日一练 c语言
题目：将输入的整形数字输出,输出1990，输出"1990"#include#defineMAX_INPUT1024intmain(){intarrr_num[MAX_INPUT];intnum,i=0;printf("请输入一个数字：");scanf_s("%d",&num);while(num!=0){arrr_num[i++]=num%10;num/=10;}printf("\"");for(
git常用命令笔记咩酱-小羊 git 笔记
###用习惯了idea总是不记得git的一些常见命令，需要用到的时候总是担心旁边站了人~~~记个笔记@_@，告诉自己看笔记不丢人初始化初始化一个新的Git仓库gitinit配置配置用户信息gitconfig--globaluser.name"YourName"gitconfig--globaluser.email"[email protected]"基本操作克隆远程仓库gitclone查看
将cmd中命令输出保存为txt文本文件落难Coder Windows cmd window
最近深度学习本地的训练中我们常常要在命令行中运行自己的代码，无可厚非，我们有必要保存我们的炼丹结果，但是复制命令行输出到txt是非常麻烦的，其实Windows下的命令行为我们提供了相应的操作。其基本的调用格式就是：运行指令>输出到的文件名称或者具体保存路径测试下，我打开cmd并且ping一下百度：pingwww.baidu.com>./data.txt看下相同目录下data.txt的输出：如果你再
从0到500+，我是如何利用自媒体赚钱？一列脚印
运营公众号半个多月，从零基础的小白到现在慢慢懂了一些运营的知识。做好公众号是很不容易的，要做很多事情；排版、码字、引流…通通需要自己解决，业余时间全都花费在这上面涨这么多粉丝是真的不容易，对比知乎大佬来说，我们这种没资源，没人脉，还没钱的小透明来说，想要一个月涨粉上万，怕是今天没睡醒（不过你有的方法，算我piapia打脸）至少我是清醒的，自己慢慢努力，实现我的万粉目标！大家快来围观、支持我吧！孩子
探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
使用Faiss进行高效相似度搜索 llzwxh888 faiss python
在现代AI应用中，快速和高效的相似度搜索是至关重要的。Faiss（FacebookAISimilaritySearch）是一个专门用于快速相似度搜索和聚类的库，特别适用于高维向量。本文将介绍如何使用Faiss来进行相似度搜索，并结合Python代码演示其基本用法。什么是Faiss？Faiss是一个由FacebookAIResearch团队开发的开源库，主要用于高维向量的相似性搜索和聚类。Faiss
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
利用LangChain的StackExchange组件实现智能问答系统 nseejrukjhad langchain microsoft 数据库 python
利用LangChain的StackExchange组件实现智能问答系统引言在当今的软件开发世界中，StackOverflow已经成为程序员解决问题的首选平台之一。而LangChain作为一个强大的AI应用开发框架，提供了StackExchange组件，使我们能够轻松地将StackOverflow的海量知识库集成到我们的应用中。本文将详细介绍如何使用LangChain的StackExchange组件
如何部分格式化提示模板:LangChain中的高级技巧 nseejrukjhad langchain java 服务器 python
标题:如何部分格式化提示模板:LangChain中的高级技巧内容:如何部分格式化提示模板:LangChain中的高级技巧引言在使用大型语言模型(LLM)时,提示工程是一个关键环节。LangChain提供了强大的提示模板功能,让我们能更灵活地构建和管理提示。本文将介绍LangChain中一个高级特性-部分格式化提示模板,这个技巧可以让你的提示管理更加高效和灵活。什么是部分格式化提示模板?部分格式化提
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
Faiss Tips：高效向量搜索与聚类的利器焦习娜Samantha
FaissTips：高效向量搜索与聚类的利器faiss_tipsSomeusefultipsforfaiss项目地址:https://gitcode.com/gh_mirrors/fa/faiss_tips项目介绍Faiss是由FacebookAIResearch开发的一个用于高效相似性搜索和密集向量聚类的库。它支持多种硬件平台，包括CPU和GPU，能够在海量数据集上实现快速的近似最近邻搜索（AN
【PG】常见数据库、表属性设置江无羡数据库
PG的常见属性配置方法数据库复制、备份相关表的复制标识单表操作批量表操作链接数据库复制、备份相关表的复制标识单表操作通过ALTER语句单独更改一张表的复制标识。ALTERTABLE[tablename]REPLICAIDENTITYFULL;批量表操作通过代码块的方式，对某个schema中的所有表一起更新其复制标识。SELECTtablename,CASErelreplidentWHEN'd'TH
Faiss：高效相似性搜索与聚类的利器网络·魚大数据 faiss
Faiss是一个针对大规模向量集合的相似性搜索库，由FacebookAIResearch开发。它提供了一系列高效的算法和数据结构，用于加速向量之间的相似性搜索，特别是在大规模数据集上。本文将介绍Faiss的原理、核心功能以及如何在实际项目中使用它。Faiss原理：近似最近邻搜索：Faiss的核心功能之一是近似最近邻搜索，它能够高效地在大规模数据集中找到与给定查询向量最相似的向量。这种搜索是近似的，
想家，想念家乡的四季三妹杨敏
不知道，为什么，这次我回自己出生地—老家，反倒有了一种出差走亲戚的感觉。人啊，出来得久了，就生分了。就不再那么心贴着心脸对着脸了。需要时间，需要机缘，需要我们再重新把自己的思维重置一遍，你才能够转得回这个弯儿的。最好的转弯儿，不是说教，也不是余旧，都有些治标不治本。真正管用的东西，只有一样。也简单。一个字：吃。吃一顿家乡的饭，喝一口家乡的水，听一听那浓重得有些陌生的乡音，心就回来了。心回来，人才算
每日一题——第八十八题互联网打工人no1 C语言程序设计每日一练 c语言
题目：输入一个9位的无符号整数，判断其是否有重复数字#include#include#includeintmain(){charnum_str[10];printf("请输入一个9位数的无符号数：");scanf_s("%9d",&num_str);if(strlen(num_str)!=9){printf("输入的不是一个9位无符号整数，请重新输入");}else{if(hasDuplicate
mac电脑命令行获取电量小米人er 我的博客 macos 命令行
在macOS上，有几个命令行工具可以用来获取电量信息，最常用的是pmset命令。你可以通过以下方式来查看电池状态和电量信息：查看电池状态：pmset-gbatt这个命令会返回类似下面的输出：Nowdrawingfrom'BatteryPower'-InternalBattery-0(id=1234567)95%;discharging;4:02remainingpresent:true输出中包括电
【Git】常见命令(仅笔记) 好想有猫猫 Git Linux学习笔记 git 笔记 elasticsearch linux c++
文章目录创建/初始化本地仓库添加本地仓库配置项提交文件查看仓库状态回退仓库查看日志分支删除文件暂存工作区代码远程仓库使用`.gitigore`文件让git不追踪一些文件标签创建/初始化本地仓库gitinit添加本地仓库配置项gitconfig-l#以列表形式显示配置项gitconfiguser.name"ljh"#配置user.namegitconfiguser.email"[email protected]
日常演播练习0822 开阳春天
日常演播练习0822一、绕口令练习司小四和史小世，四月十四日十四时四十上集市，司小四买了四十四斤四两西红柿，史小世买了十四斤四两细蚕丝。司小四要拿四十四斤四两西红柿换史小世十四斤四两细蚕丝。史小世十四斤四两细蚕丝不换司小四四十四斤四两西红柿。司小四说我四十四斤四两西红柿可以增加营养防近视，史小世说我十四斤四两细蚕丝可以织绸织缎又抽丝。二、文本练习狗熊是动物街有名的美食家，它吃得多所以长得胖，它能吃
jvm调优总结（从基本概念到深度优化） oloz java jvm jdk 虚拟机应用服务器
JVM参数详解：http://www.cnblogs.com/redcreen/archive/2011/05/04/2037057.html Java虚拟机中，数据类型可以分为两类：基本类型和引用类型。基本类型的变量保存原始值，即：他代表的值就是数值本身；而引用类型的变量保存引用值。“引用值”代表了某个对象的引用，而不是对象本身，对象本身存放在这个引用值所表示的地址的位置。
【Scala十六】Scala核心十：柯里化函数 bit1129 scala
本篇文章重点说明什么是函数柯里化，这个语法现象的背后动机是什么，有什么样的应用场景，以及与部分应用函数(Partial Applied Function)之间的联系 1. 什么是柯里化函数 A way to write functions with multiple parameter lists. For instance def f(x: Int)(y: Int) is a
HashMap dalan_123 java
HashMap在java中对很多人来说都是熟的；基于hash表的map接口的非同步实现。允许使用null和null键；同时不能保证元素的顺序；也就是从来都不保证其中的元素的顺序恒久不变。 1、数据结构在java中，最基本的数据结构无外乎：数组和引用（指针），所有的数据结构都可以用这两个来构造，HashMap也不例外，归根到底HashMap就是一个链表散列的数据
Java Swing如何实时刷新JTextArea，以显示刚才加append的内容周凡杨 java 更新 swing JTextArea
在代码中执行完textArea.append("message")后，如果你想让这个更新立刻显示在界面上而不是等swing的主线程返回后刷新，我们一般会在该语句后调用textArea.invalidate()和textArea.repaint()。问题是这个方法并不能有任何效果，textArea的内容没有任何变化，这或许是swing的一个bug，有一个笨拙的办法可以实现
servlet或struts的Action处理ajax请求 g21121 servlet
其实处理ajax的请求非常简单，直接看代码就行了： //如果用的是struts //HttpServletResponse response = ServletActionContext.getResponse(); // 设置输出为文字流 response.setContentType("text/plain"); // 设置字符集 res
FineReport的公式编辑框的语法简介老A不折腾 finereport 公式总结
FINEREPORT用到公式的地方非常多，单元格（以=开头的便被解析为公式），条件显示，数据字典，报表填报属性值定义，图表标题，轴定义，页眉页脚，甚至单元格的其他属性中的鼠标悬浮提示内容都可以写公式。简单的说下自己感觉的公式要注意的几个地方： 1.if语句语法刚接触感觉比较奇怪，if(条件式子,值1,值2)，if可以嵌套，if(条件式子1，值1，if(条件式子2，值2，值3)
linux mysql 数据库乱码的解决办法墙头上一根草 linux mysql 数据库乱码
linux 上mysql数据库区分大小写的配置 lower_case_table_names=1 1-不区分大小写 0-区分大小写修改/etc/my.cnf 具体的修改内容如下: [client] default-character-set=utf8 [mysqld] datadir=/var/lib/mysql socket=/va
我的spring学习笔记6-ApplicationContext实例化的参数兼容思想 aijuans Spring 3
ApplicationContext能读取多个Bean定义文件，方法是： ApplicationContext appContext = new ClassPathXmlApplicationContext（ new String[]｛“bean-config1.xml”，“bean-config2.xml”，“bean-config3.xml”，“bean-config4.xml
mysql 基准测试之sysbench annan211 基准测试 mysql基准测试 MySQL测试 sysbench
1 执行如下命令，安装sysbench-0.5： tar xzvf sysbench-0.5.tar.gz cd sysbench-0.5 chmod +x autogen.sh ./autogen.sh ./configure --with-mysql --with-mysql-includes=/usr/local/mysql
sql的复杂查询使用案列与技巧百合不是茶 oracle sql 函数数据分页合并查询
本片博客使用的数据库表是oracle中的scott用户表; ------------------- 自然连接查询查询 smith 的上司(两种方法) &
深入学习Thread类 bijian1013 java thread 多线程 java多线程
一．线程的名字下面来看一下Thread类的name属性，它的类型是String。它其实就是线程的名字。在Thread类中，有String getName()和void setName(String)两个方法用来设置和获取这个属性的值。同时，Thr
JSON串转换成Map以及如何转换到对应的数据类型 bijian1013 java fastjson net.sf.json
在实际开发中，难免会碰到JSON串转换成Map的情况，下面来看看这方面的实例。另外，由于fastjson只支持JDK1.5及以上版本，因此在JDK1.4的项目中可以采用net.sf.json来处理。一.fastjson实例 JsonUtil.java package com.study; impor
【RPC框架HttpInvoker一】HttpInvoker：Spring自带RPC框架 bit1129 spring
HttpInvoker是Spring原生的RPC调用框架，HttpInvoker同Burlap和Hessian一样，提供了一致的服务Exporter以及客户端的服务代理工厂Bean，这篇文章主要是复制粘贴了Hessian与Spring集成一文，【RPC框架Hessian四】Hessian与Spring集成在【RPC框架Hessian二】Hessian 对象序列化和反序列化一文中
【Mahout二】基于Mahout CBayes算法的20newsgroup的脚本分析 bit1129 Mahout
#!/bin/bash # # Licensed to the Apache Software Foundation (ASF) under one or more # contributor license agreements. See the NOTICE file distributed with # this work for additional information re
nginx三种获取用户真实ip的方法 ronin47
随着nginx的迅速崛起，越来越多公司将apache更换成nginx. 同时也越来越多人使用nginx作为负载均衡, 并且代理前面可能还加上了CDN加速，但是随之也遇到一个问题：nginx如何获取用户的真实IP地址,如果后端是apache,请跳转到<apache获取用户真实IP地址>，如果是后端真实服务器是nginx，那么继续往下看。实例环境：用户IP 120.22.11.11
java-判断二叉树是不是平衡 bylijinnan java
参考了 http://zhedahht.blog.163.com/blog/static/25411174201142733927831/ 但是用java来实现有一个问题。由于Java无法像C那样“传递参数的地址，函数返回时能得到参数的值”，唯有新建一个辅助类：AuxClass import ljn.help.*; public class BalancedBTree {
BeanUtils.copyProperties VS PropertyUtils.copyProperties 诸葛不亮 PropertyUtils BeanUtils
BeanUtils.copyProperties VS PropertyUtils.copyProperties 作为两个bean属性copy的工具类，他们被广泛使用，同时也很容易误用，给人造成困然；比如：昨天发现同事在使用BeanUtils.copyProperties copy有integer类型属性的bean时，没有考虑到会将null转换为0，而后面的业
[金融与信息安全]最简单的数据结构最安全 comsci 数据结构
现在最流行的数据库的数据存储文件都具有复杂的文件头格式，用操作系统的记事本软件是无法正常浏览的，这样的情况会有什么问题呢？从信息安全的角度来看，如果我们数据库系统仅仅把这种格式的数据文件做异地备份，如果相同版本的所有数据库管理系统都同时被攻击，那么
vi区段删除 Cwind linux vi 区段删除
区段删除是编辑和分析一些冗长的配置文件或日志文件时比较常用的操作。简记下vi区段删除要点备忘。 vi概述引文中并未将末行模式单独列为一种模式。单不单列并不重要，能区分命令模式与末行模式即可。 vi区段删除步骤： 1. 在末行模式下使用:set nu显示行号非必须，随光标移动vi右下角也会显示行号，能够正确找到并记录删除开始行
清除tomcat缓存的方法总结 dashuaifu tomcat 缓存
用tomcat容器，大家可能会发现这样的问题，修改jsp文件后，但用IE打开依然是以前的Jsp的页面。出现这种现象的原因主要是tomcat缓存的原因。解决办法如下: 在jsp文件头加上 <meta http-equiv="Expires" content="0"> <meta http-equiv="kiben&qu
不要盲目的在项目中使用LESS CSS dcj3sjt126com Web less
　如果你还不知道LESS CSS是什么东西，可以看一下这篇文章，是我一朋友写给新人看的《CSS——LESS》　　不可否认，LESS CSS是个强大的工具，它弥补了css没有变量、无法运算等一些“先天缺陷”，但它似乎给我一种错觉，就是为了功能而实现功能。　　比如它的引用功能 ? .rounded_corners{
[入门]更上一层楼 dcj3sjt126com PHP yii2
更上一层楼通篇阅读完整个“入门”部分，你就完成了一个完整 Yii 应用的创建。在此过程中你学到了如何实现一些常用功能，例如通过 HTML 表单从用户那获取数据，从数据库中获取数据并以分页形式显示。你还学到了如何通过 Gii 去自动生成代码。使用 Gii 生成代码把 Web 开发中多数繁杂的过程转化为仅仅填写几个表单就行。本章将介绍一些有助于更好使用 Yii 的资源：
Apache HttpClient使用详解 eksliang httpclient http协议
Http协议的重要性相信不用我多说了，HttpClient相比传统JDK自带的URLConnection，增加了易用性和灵活性（具体区别，日后我们再讨论），它不仅是客户端发送Http请求变得容易，而且也方便了开发人员测试接口（基于Http协议的），即提高了开发的效率，也方便提高代码的健壮性。因此熟练掌握HttpClient是很重要的必修内容，掌握HttpClient后，相信对于Http协议的了解会
zxing二维码扫描功能 gundumw100 android zxing
经常要用到二维码扫描功能现给出示例代码 import com.google.zxing.WriterException; import com.zxing.activity.CaptureActivity; import com.zxing.encoding.EncodingHandler; import android.app.Activity; import an
纯HTML+CSS带说明的黄色导航菜单 ini html Web html5 css hovertree
HoverTree带说明的CSS菜单:纯HTML+CSS结构链接带说明的黄色导航在线体验效果：http://hovertree.com/texiao/css/1.htm代码如下,保存到HTML文件可以看到效果： <!DOCTYPE html > <html > <head> <title>HoverTree
fastjson初始化对性能的影响 kane_xie fastjson 序列化
之前在项目中序列化是用thrift，性能一般，而且需要用编译器生成新的类，在序列化和反序列化的时候感觉很繁琐，因此想转到json阵营。对比了jackson，gson等框架之后，决定用fastjson，为什么呢，因为看名字感觉很快。。。网上的说法： fastjson 是一个性能很好的 Java 语言实现的 JSON 解析器和生成器，来自阿里巴巴的工程师开发。
基于Mybatis封装的增删改查实现通用自动化sql mengqingyu DAO
1.基于map或javaBean的增删改查可实现不写dao接口和实现类以及xml，有效的提高开发速度。 2.支持自定义注解包括主键生成、列重复验证、列名、表名等 3.支持批量插入、批量更新、批量删除 <bean id="dynamicSqlSessionTemplate" class="com.mqy.mybatis.support.Dynamic
js控制input输入框的方法封装(数字，中文，字母，浮点数等) qifeifei javascript js
在项目开发的时候，经常有一些输入框，控制输入的格式，而不是等输入好了再去检查格式，格式错了就报错，体验不好。 /** 数字，中文，字母,浮点数(+/-/.) 类型输入限制，只要在input标签上加上 jInput="number,chinese,alphabet,floating" 备注：floating属性只能单独用*/ funct
java 计时器应用 tangqi609567707 java timer
mport java.util.TimerTask; import java.util.Calendar; public class MyTask extends TimerTask { private static final int
erlang输出调用栈信息 wudixiaotie erlang
在erlang otp的开发中，如果调用第三方的应用，会有有些错误会不打印栈信息，因为有可能第三方应用会catch然后输出自己的错误信息，所以对排查bug有很大的阻碍，这样就要求我们自己打印调用的栈信息。用这个函数：erlang:process_display (self (), backtrace).需要注意这个函数只会输出到标准错误输出。也可以用这个函数：erlang:get_s