Vvvvonly

Towards Open-Set Identity Preserving Face Synthesis

[1803.11182] Towards Open-Set Identity Preserving Face Synthesis

文章目录

Abstract
1. Introduction

（1）与其他网络对比
（2）本文原理

2. Related work
3. 保留身份信息的GAN

3.1 身份信息和属性信息的分离

3.1.1 提取身份向量
3.1.2 提取属性向量

3.2 对网络G,C,D的非对称训练
3.3 非监督训练
3.4 全局目标函数

4. 实验

4.1 框架分析
4.2 KL散度损失
4.3 脸部属性转移
4.4 人脸属性调整
4.5 人脸对抗实例检测

5. 总结

Abstract

Previous identity preserving face synthesis processes are largely confined to synthesizing faces with known identities that are already in the training dataset. Our proposed framework does not need to annotate the attributes of faces in any way. It is trained with an asymmetric loss function to better preserve the identity and stabilize the training process. It can also effectively leverage large amounts of unlabeled training face images to further improve the fidelity of the synthesized faces for subjects that are not presented in the labeled training face dataset.

之前的保留身份的人脸合成过程都限制于数据集中已知身份的人脸合成，而本文可训练数据集外的人脸。
本文提出的架构不需要对人脸属性做任何标注。
本文采用非对称函数来更好的保留身份信息和使训练过程稳定。
可高效率利用大量的无标签脸部图片来提高合成的质量。

1. Introduction

（1）与其他网络对比

Many previous works have attempted to synthesize face images of a specific person. For example, TP-GAN [14] and FF-GAN [36] attempt to synthesize the frontal view of a face from a single face image. DR-GAN [33] can change the pose of an input face image. However, these methods can only manipulate limited types of attributes, such as poses. These methods also require full annotation of attributes for training the models. More recent work, such as CVAE- GAN [4], can produce a variety of attribute changes. Nevertheless, it is not able to synthesize a face with an identity outside the training dataset.

许多之前的工作尝试合成特定的人脸。比如TP-GAN, FF-GAN（通过单一脸部图像合成正脸图像）, DR-GAN（改变输入脸部图像的表情）。

但这些方法都仅能修改某种限定属性，而且要求输入图片属性的所有标注来训练模型。
CVAE-GAN可以修改很多属性，但不能合成来自训练集以外的人脸。

（2）本文原理

To synthesize a face with an identity outside the training dataset, we require one input image of that subject to produce an identity vector, and any other input face image to extract an attribute vector capturing, e.g., pose, emotion, illumination, and even background. We then combine the identity vector and the attribute vector to synthesize a new face of the subject with the extracted attribute.
To this end, we propose a framework based on Generative Adversarial Networks to disentangle identity and attributes given a face image, and recombine different identities and attributes for identity preserving face synthesis.

我们需要一个主体的输入图像来提供一个身份向量，和其他输入的脸部图像来提取一个属性向量捕获，比如姿态、感情等。然后我们将这些身份向量和提取到的属性向量合成来合成主体的新脸部。

末端的GAN用来分离给定脸部图片的身份和属性，并将不同的身份和属性重组来做保留身份的脸部合成。

框架由五部分组成：1）身份编码网络I ；2）属性编码网络A；3）生成网络G，通过组合身份和属性来合成人脸；4）分类网络C，保留生成的人脸的身份信息；5）判别网络D，区分真实的和生成的实例。这五个部分的训练方式是端对端。（3）损失函数

We use two loss functions: 1) a reconstruction loss of the attribute image, and 2) a KL divergence loss defined on the attribute vector. These functions enforce that network A extracts the attribute information.We take full advantage of recent advancements in face recognition, and use the softmax loss on top of network I to encode the identity into an attribute independent vector representation. Therefore, in order to reconstruct the input, network A is forced to extract the attribute information. Meanwhile, we add a KL divergence loss to regularize the attribute vector, such that it dose not contain identity information.
Inspired by the CVAE-GAN [4], we adopt a new asymmetric loss function. More specifically, we adopt a cross-entropy loss when training the discriminative network D, and the classification network C, and use a pairwise feature matching loss when updating the generative network G. This does a better job of preserving the identity while stabilizing the training process.

Ⅰ. 使用了两个损失函数：

（1）定义在属性图片上的重构损失。在I网络的顶端使用softmax损失函数来将身份编码为一个独立于属性的向量表示。

（2）定义在属性向量上的KL散度损失。在提取属性信息的A网络上加入一个KL散度损失来正则化属性向量，使其不包含身份信息。

Ⅱ. 采用了一种新的不对称的损失函数。

（1）在训练判别器D和分类器C的时候采用交叉熵损失；

（2）在更新生成器G的时候采用成堆的特征匹配损失。

本文的网络可以高效利用大量的无标签脸部训练图片来提高合成数据集中没有的脸的保真度。这些无标签数据可以增大类内和类间人脸分布差异以提高合成人脸的多样性，所以生成的人脸在姿态和表情上有更大的变化。

2. Related work

In contrast, this paper proposes an Identity PreservingGenerative Adversarial Network framework, which does not require any attribute annotations. This framework disentangles the identity and attributes representations, and then uses different recombinations of representations for identity preserving face synthesis. This disentaglement allows us to synthesize faces with identities outside what is presented in the training datasets. This addresses a serious limitation of a previous deep generative model-based identity preserving face synthesis method [4]. It simply can not generate faces of identities outside the training dataset.

对比之下，本文提出了一种保留身份的GAN，它并不要求任何属性注释。本文的结构将身份和属性分离，然后使用不同表示形式的组合来做保留身份的人脸合成。这种分离使我们可以合成训练集中没有的人脸，而其他的方法不能。

3. 保留身份信息的GAN

实线：输入输出虚线：损失函数
$I$ 从图片 $x^s$ 中提取身份向量 $f_I(x^s)$ 。从属性图片中提取属性向量 $f_A(x^a)$ 。G通过组合身份向量和属性向量 $f_I(x^s)^T, f_A(x^a)^T]^T$ 来生成一个新的脸部图片 $x^{'}$ 。C通过后验概率 $P(c|x^s)$ 来保留身份信息，其中c是身份信息x^s的主体（类别/标签）。判别网络D用来区分真实图片和生成图片。

3.1 身份信息和属性信息的分离

In our training data, we only have the annotation of the identity of each face, without any annotation of the attribute information. Extracting the identity vector is relatively straightforward. Here, we take full advantage of recent improvement in face recognition.

训练数据有身份信息的标注，没有属性信息的标注。

3.1.1 提取身份向量

给定脸部图片的身份信息 ${x_i^s,c_i\}（x_i^s$ 是身份向量， $c_i$ 是类别），我们使用softmax损失来训练网络身份向量提取网络I，使其做脸部分类的工作。相同的个体拥有大致相同的特征（身份向量）。I的损失函数： $L_I=-\mathbb{E}_{x\sim P_r}[logP(c|x^s)]$ ，然后我们用I最后一个池化层的响应作为特征向量。

3.1.2 提取属性向量

采用完全无监督的方式训练A，训练过程中采用两个损失函数：重建损失和KL散度损失。

重建损失
这里我们有两种情况：主体图像x^{s与属性图像x}a相同和不同。两种情况中，我们都需要x’来重构属性图像x^a，但是有不同的损失权重。重构损失函数表达式为：

其中 $\lambda$ 是重构损失权重。

当 $x^s与x^a$ 相同时，输出的 $x^{'}$ 也一定与这两者相同。假定一个身份信息有很多不同的脸部图像，那么身份向量 $f_I(x)$ 几乎对所有的样本都大致相同。但是使用不同样本的 $f_I(x)和f_A(x)$ 的重构是不同的。因此，重构损失使属性编码网络 $A$ 学习不同的属性表示 $f_A(x)$ 。

当身份图片和属性图片不同时，我们不能明确知道重构结果看起来应该是什么样。但是我们可以期望重构结果与属性图片 $x^a$ 类似，比如背景、全图光亮、姿势等。所以我们采用一个权值相对较小的像素重建损失来保留其属性。我们将 $\lambda$ 设为0.1。而后的实验也证明，如果设定一个大的权值\lambda，结果会很差。
KL散度损失

To help the attributes encoder network learn better representations, we also add a KL divergence loss to regularize the attribute vector with an appropriate prior P(z) . The KL divergence loss will limit the distribution range of the attribute vector, such that it dose not contain much identity information, if at all. For each input face image, the network A outputs the mean µ and covariance of the latent vector. We use the KL divergence loss to reduce the gap between the prior P(z) and the learned distributions, i.e., $L_{KL}=\frac{1}{2}(\mu ^T\mu+\sum_{j-1}^J(e^{\epsilon}-\epsilon-1))$
we sample the attribute vector using $\mu + r ⊙ e^ε$ in the training phase, where $r \sim N (0, I)$ is a random vector and ⊙ represents the element-wise multiplication.

加入KL损失，使用 $P (z) N (0, 1)$ 来正则化属性向量。KL散度损失可以限制属性向量的范围使其不包含太多身份信息。对于每个输入的脸部图片，A（提取属性特征）网络输出均值μ和协方差。使用KL散度损失可以降低先验概率P(z)和学习到的分布之间的差异。

公式解读：μ为均值，j为向量ε的第j个元素。

采用z来对属性向量取样，其中r是高斯随机向量，r与 $e^ε$ 做逐元素乘法。

3.2 对网络G,C,D的非对称训练

生成网络G和辨别网络D——成对特征匹配（针对属性向量）
为了解决梯度消失问题，向生成器G提出pairwise feature matching objective（成对特征匹配目标），匹配真假图片在辨别器D中的特征。令 $f_D(x)$ 表示辨别器D中间层特征（为了简化，采用辨别网络D最后一层FC层的输入），则采用欧几里得距离衡量辨别网络中生成图片和属性图片的特征： $L_{GD}=\frac{1}{2}||f_D(x')-f_D(x^a)||^2_2$ 。
分类网络C——最大化身份信息匹配正确的概率（针对身份向量）
（1）身份信息与标签的正确匹配

分类网络C尝试区分不同身份的脸部图像，即最小化损失函数 $L_C=-\mathbb{E}_{x\sim P_x}[logP(c|x^s)]$

（2）身份信息与生成网络G生成图片的正确匹配

为了生成保留身份信息的脸部图片，依然采用该方法以激励 $x^{'}$ 和 $x^s$ 在分类网络C中具有相同特征表示。令 $f_C(x)$ 表示分类网络C的中间层的输出特征（采用分类网络C最后一个全连接层的输入），特征重构函数损失为 $L_{GC}=\frac{1}{2}||f_C(x’)-|f_C(x^s)||^2_2$ 。
总结说明
（1）组合多层特征仅仅可以稍微提升生成网络G保留身份信息的能力；

（2）身份提取网络I和分类网络C共享参数，且可通过脸部分类网络预训练以加快收敛速度。

3.3 非监督训练

生成训练集中没有的脸部图片这一任务要求生成网络G覆盖所有脸部的类内和类间差异。而带标签的训练集在大小、姿势、光照等方面受限，即不具有多样性。所以在网站上随机收集一百万张人脸图像，并用人脸检测器定位人脸。

没有标签的图像可用作（1）身份图片。由于没有标签，所以不加 $L_I和L_C$ 。即固定I和C对其他部分进行训练；（2）属性图片。训练方式不变。

3.4 全局目标函数

最终的损失函数是以上所有损失函数的和。即使损失函数很多，但是每个网络只与损失函数的一部分有关，所以很好训练。

训练中将每一次迭代分为两步：（1）重建过程，即 $x^s=x^a$ ；（2）转换过程，即 $x^a \neq x^s$ 。

4. 实验

对每张图片检测其脸部区域，然后对齐并调整尺寸为128*128像素。
对网络 $I, C, A$ 采用VGG网络。 $I 和 C$ 共享参数以加快收敛。 $G$ 是一个反向VGG结构。其池化层改为上采样层，卷积层改为去卷积层。 $D$ 采用与DCGAN相同的网络结构。批量归一化层用在每个卷积层和去卷积层之后。

4.1 框架分析

为了理解网络每一部分的工作效果，我们采用不同的损失函数组合。在此对比了五种可能：（1）去掉 $L_{GD}$ （2）去掉 $L_{GC}$ （3）去掉transformation训练过程（4）去掉无监督学习过程（5）所有部分都包含的最佳模型。
在数据集中选取了1万个身份，对于每一个身份主体，选取六张照片（这些照片都不在我们的训练集中），一张存放在gallery中，五张用于queries。利用每个queries和随机选取五张属性图片生成五张新的图片，然后寻找gallery中与生成图片最相似的脸，测量其top 1精度。
对于不在数据集中的身份信息，在Multi-PIE中选取六种属性图片。对数据集中的每个人，其中一种属性的脸部作为gallery，queries是原始的脸部图片和剩余五种属性图片生成的图片。

表格显示，每一种成分都对网络做了提升。其中 $L_{GC}$ 提升最大。同时我们也衡量了使用真实query图像时的top-1精度，我们的生成图像获得了类似的结果。

图片3显示了量化结果。我们发现去掉transformation训练过程会导致生成结果丢失很多属性细节，尤其是表情信息。去掉 $L_{GD}$ 损失会导致生成图片的模糊。去掉 $L_{GC}$ 使生成图片无法保留身份信息。加上无监督学习后生成图片表现更好，比如最后一行第一张图片，嘴张得更大。

4.2 KL散度损失

在这里讨论KL散度损失可以移除属性向量中的身份信息。
首先训练有无KL散度损失的连个模型。将数据集中的脸部随机分为两部分，一部分作为训练集，另一部分为验证集。用A提取属性向量，用MLP（多层感知机）训练分类模型来区分不同身份主体的脸部特征。同样测量其top-1精度。

结果如图，有KL散度损失的模型在验证集上top-1精度更低，即不具有更少的身份信息。

4.3 脸部属性转移

脸部属性转移的目标是生成一张组合了 $x^s$ 身份信息和 $x^a$ 属性信息的图片 $KaTeX parse error: Expected group after '^' at position 2: x^̲'$ 。实验生成两种脸部图片：身份信息在与不在训练集中的脸部图片。
如图，两种表现都很好。
另外本文网络还可以用于脸部对正。即输入一张正脸作为属性图片，网络可以生成保留身份信息的正脸图片。对比之前的工作，本文网络可以保留光照和肤色。

4.4 人脸属性调整

这一部分用来证明生成图片的属性会随潜在向量而不断变化。我们称之为脸部属性调整。
首先选取一对图片 $x_1$ ， $x_2$ ，并用A提取其属性向量 $z_1$ ， $z_2$ 。令 $z=\alpha z_1+(1-\alpha)z_2, \alpha \in [0, 1]$ .我们可以逐渐改变其姿态、表情、光照。效果如图。

4.5 人脸对抗实例检测

对抗性实例使系统的安全性存在风险，这一部分用来证明本文的网络不需修改就可用于人脸对抗实例检测。
略。

5. 总结

基于oracle linux的 DBI/DBD 标准化安装文档(二) 文档
一、安装DBIDBI(DatabaseInterface)是perl连接数据库的接口。其是perl连接数据库的最优方法，他支持包括Orcale,Sybase,mysql,db2等绝大多数的数据库，下面将简要介绍其安装方法。1.1解压tar-zxvfDBI-1.616_901.tar.gz1.2安装依赖yuminstallperl-ExtUtils-CBuilderperl-ExtUtils-Mak
#PyCharm 2024.1新增功能 Dingdangr pycharm ide python
PyCharm2024.1作为JetBrains专为Python开发者设计的集成开发环境（IDE）的最新版本，带来了众多令人兴奋的新增功能，旨在提升开发者的编程效率和体验。以下是对这些新增功能的详细解析：一、智能编码辅助HuggingFace模型和数据集文档预览PyCharm2024.1引入了HuggingFace模型和数据集的快速文档预览功能。开发者可以直接在PyCharm内部快速获取Huggi
基于oracle linux的 DBI/DBD 标准化安装文档（三） oracle
一、安装DBIDBI(DatabaseInterface)是perl连接数据库的接口。其是perl连接数据库的最优方法，他支持包括Orcale,Sybase,mysql,db2等绝大多数的数据库，下面将简要介绍其安装方法。1.1解压tar-zxvfDBI-1.616_901.tar.gz1.2安装依赖yuminstallperl-ExtUtils-CBuilderperl-ExtUtils-Mak
基于Java的家居设备控制系统设计与实现不知江月待何人.. java java 开发语言
目录项目目标设计思路系统架构核心实现运行演示存在问题与优化总结项目目标实现四种家居设备（灯/空调/电视/洗衣机）的智能控制系统，要求：统一管理设备开关状态支持状态反转操作提供简洁的控制接口具备扩展性支持新设备接入设计思路面向对象设计原则抽象原则：通过接口定义通用行为继承机制：建立家电父类统一管理基础属性多态应用：使用父类数组管理子类对象单例模式：控制系统唯一入口类关系图«interface»Swi
C#接口(Interface)必须掌握的核心概念 ByteGeek‌ C#基础从入门到精通 c#开发语言 .net Winform VS
文章目录前言接口的定义接口的实现接口的继承接口的用途注意事项前言在C#编程语言中，‌接口（Interface）‌是一个至关重要的概念，它属于引用类型，主要用于指定一组方法，但不提供这些方法的实际实现。接口充当了一种契约或规范，类或其他类型可以通过实现这些接口来遵循这一契约。以下是对C#接口的详细阐述：接口的定义接口通过interface关键字进行定义，并且可以包含方法、属性、事件和索引器。然而，与
Java与Javaweb知识点总结一朵忧伤的蔷薇 java 开发语言
Java基础知识基本语法：数据类型：基本数据类型（int,char,boolean,etc.）和引用数据类型（String,Arrays,etc.）。控制结构：条件语句（if,switch）、循环语句（for,while,do-while）。面向对象编程：类与对象：类的定义与实例化。继承与多态：使用extends和interface实现继承、多态的应用。封装：访问控制修饰符（public,priv
华为路由器配置DHCP服务以及配置端口网关IP 百里清风20190301 华为 tcp/ip 网络协议
实验拓扑结构：前提：HTTP服务器已启动http服务和配置好ip地址，client1与client2已配置不同网段的IP，路由器两端接口已预设IP实验需求：除平板服务器外，电脑自动获取IP配置子网掩码和DNS域名解析服务并且能实现全网通信步骤一：为两个不同的广播域配置网关IPsystem-view#进入系统视图[Huawei]interfaceg0/0/0#进入系统视图[Huawei-Gigabi
大模型工程师学习日记（十五）：Hugging Face 模型微调训练（基于 BERT 的中文评价情感分析） MMMMMMMay Love Code 学习 bert 人工智能深度学习自然语言处理全量微调
1.datasets库核心方法1.1.列出数据集使用datasets库，你可以轻松列出所有HuggingFace平台上的数据集：fromdatasetsimportlist_datasets#列出所有数据集all_datasets=list_datasets()print(all_datasets)1.2.加载数据集你可以通过load_dataset方法加载任何数据集：fromdatasetsim
【模拟面试】计算机考研复试集训（第二天） Albert Edison 计算机考研复试高频考点面试考研职场和发展 c++数据结构算法操作系统
文章目录前言一、专业面试1、OSI参考模型和TCP/IP模型的主要区别是什么？简述各层功能2、什么是瀑布模型？其优缺点是什么？3、什么是递归？使用时需注意什么？4、监督学习与无监督学习的核心区别是什么？请举例说明典型算法5、你在项目中遇到过哪些技术挑战？是如何解决的？二、英文口语1、Canyoutellusaboutatimeyouworkedinateamandfacedchallenges?H
聊聊langchain4j的AiServices llm
序本文主要研究一下langchain4j的AiServices示例原生版本publicinterfaceAssistant{Stringchat(StringuserMessage);}构建Assistantassistant=AiServices.create(Assistant.class,chatLanguageModel);Stringresp=assistant.chat(userMes
1025. 【USACO题库】2.2.1 Preface Numbering序言页码 (❁´◡`❁)Jimmy(❁´◡`❁) 粉丝才可以看的NC题解算法
文章目录题目描述输入输出样例输入样例输出题解代码题目描述一类书的序言是以罗马数字标页码的。传统罗马数字用单个字母表示特定的数值，一下是标准数字表:I1L50M1000V5C100X10D500最多3个可以表示为10n的数字(I,X,C,M)可以连续放在一起，表示它们的和:III=3CCC=300可表示为5x10n的字符(V,L,D)从不连续出现。除了下一个规则，一般来说，字符以递减的顺序接连出现:
max_samples，batch_size，gradient_accumulation_steps这三个分别的联系和区别背太阳的牧羊人模型微调 batch 机器学习人工智能
这三个参数都是控制训练数据如何被处理的，它们的作用和区别如下：1.max_samples（最大样本数）定义：限制每个数据集最多使用多少条数据。作用：控制总共参与训练的数据量，减少max_samples可以加快训练速度。你的代码示例：max_samples=300#每个数据集最多用300条样本解释：假设你的dataset里包含：identity数据集有10,000条数据alpaca_en_demo数
聊聊langchain4j的ChatMemory langchain4j
序本文主要研究一下langchain4j的ChatMemoryChatMemorylangchain4j-core/src/main/java/dev/langchain4j/memory/ChatMemory.javapublicinterfaceChatMemory{/***TheIDofthe{@linkChatMemory}.*@returnTheIDofthe{@linkChatMemo
聊聊langchain4j的ChatMemory langchain4j
序本文主要研究一下langchain4j的ChatMemoryChatMemorylangchain4j-core/src/main/java/dev/langchain4j/memory/ChatMemory.javapublicinterfaceChatMemory{/***TheIDofthe{@linkChatMemory}.*@returnTheIDofthe{@linkChatMemo
算法在各领域的广泛应用：100 个实例全解析软件职业规划 AI&模型算法
一、互联网与信息技术领域搜索引擎算法：如谷歌的PageRank算法，用于根据网页的重要性和相关性对搜索结果进行排序，帮助用户快速找到所需信息。推荐系统算法：例如亚马逊和Netflix使用的协同过滤算法。根据用户的历史行为（购买、观看记录等）和其他相似用户的偏好，为用户推荐可能感兴趣的产品或内容。社交网络分析算法：用于分析社交网络中的用户关系，如Facebook通过算法发现用户的好友推荐、社区划分等
匿名内部类 qq_52983535 JAVA java 开发语言
匿名内部类接口的匿名内部类继承的匿名内部类匿名内部类在日常编写代码的过程中，总是会遇到匿名内部类的使用，但是对这一块一直不是很熟，所以这里总结记录一下。只讲实用。接口的匿名内部类正常如果要使用一个接口，如下代码：publicinterfaceKp{publicabstractvoidshow();}publicclassKpImplimplementsKp{@Overridepublicvoids
HuggingFace下载模型并导入Ollama指南 Repetion_Maxumim embedding 语言模型人工智能自然语言处理 ai
此处以moka-ai/m3e-base模型下载为例。众所周知，HuggingFace仓库托管了诸多训练模型。DeepSeek官方也将完整满血版DeepSeek-R1:671B模型镜像托管在此仓库，但是目前国内无法直接从HugingFace下载。并且，一般为了快速部署，会选择Ollama这类管模型管理工具，类似Docker引擎一样，但是Ollama支持的模型镜像格式（如GGUF）HuggingFac
【eNSP实战】基本ACL实现网络安全敲键盘的Q 网络
拓扑图要求：PC3不允许访问其他PC和Server1PC2允许访问Server1服务器，不允许其他PC访问各设备IP配置如图所示，这里不做展示AR1接口vlan配置vlanbatch102030#interfaceVlanif10ipaddress192.168.1.254255.255.255.0#interfaceVlanif20ipaddress192.168.2.254255.255.25
【eNSP实战】配置NAPT（含动态NAT）敲键盘的Q 网络
拓扑图要求：10.0.1.10和10.0.1.11这两个地址给内网计算机做NAPT使用设置地址如图所示AR1接口配置interfaceGigabitEthernet0/0/0ipaddress10.0.1.1255.255.255.0#interfaceGigabitEthernet0/0/1ipaddress192.168.0.1255.255.255.0#iproute-static0.0.0
【Transformer-Hugging Face手册 07/10】微调预训练模型无水先生人工智能高级阶段人工智能综合 transformer 深度学习人工智能
微调预训练模型-目录一、说明二、在本机PyTorch中微调预训练模型。2.1加载数据2.2训练2.2.1使用PyTorchTrainer进行训练2.3训练超参数2.4评价2.5训练类三、使用Keras训练TensorFlow模型3.1为Keras加载数据3.2将数据加载为tf.data.Dataset3.3数据加载器3.4优化器和学习率调度器3.5训练循环3.6评价四、结论一、说明使用预训练模
【eNSP实战】使用ACL实现路由器安全敲键盘的Q 网络
拓图要求：允许10.0.0.0网段telent登录AR1，不允许其他主机telnet登录路由器设置接口如图所示AR1接口配置interfaceGigabitEthernet0/0/0ipaddress30.0.0.1255.255.255.0#iproute-static0.0.0.00.0.0.030.0.0.2AR2接口配置interfaceGigabitEthernet0/0/0ipaddr
大模型LLM基于PEFT的LoRA微调详细步骤---第一篇：模型下载篇素雪风华大模型下载 Huggingface 魔搭社区 transformer
模型下载：HuggingFace官网：https://huggingface.co/----需要VPN魔搭社区：https://modelscope.cn/home----国内映射，不需要VPN写在篇始：国内关注方法一即可。其余几种都需要VPN，而且在服务器下载的速度有限~~。下一篇：微调详细流程以及环境...方法一：魔搭（modelscope）下载#需要安装pipinstallmodelscop
spring BeanFactory解析 yulin959 spring
BeanFactory是spring容器的根容器,定义和约定了获取对象.定义了spring管理的对象的生命周期;生命周期如下:Beanfactoryimplementationsshouldsupportthestandardbeanlifecycleinterfacesasfaraspossible.Thefullsetofinitializationmethodsandtheirstandar
MybatisPlus查询结果返回值为null 雾林小妖 Java开发常见BUG解决方案 java spring mybatis springboot
1、问题描述返回值为null，程序不报错，但是条数好像是正确的。我出现问题的代码如下：1、自定义类StudentMapper继承了BaseMapper接口publicinterfaceStudentMapperextendsBaseMapper{}2、使用StudentMapper中的selectList方法查询数据的时候，打印结果的时候返回值都会null，但是条数没有问题，也就是有几条数据就返回
手动部署？NONONO，动态上传热部署才是王道！！架构文摘JGWZ 接口学习后端 spring
近期开发系统过程中遇到的一个需求，系统给定一个接口，用户可以自定义开发该接口的实现，并将实现打成jar包，上传到系统中。系统完成热部署，并切换该接口的实现。定义简单的接口这里以一个简单的计算器功能为例，接口定义比较简单，直接上代码。public interface Calculator { int calculate(int a, int b); int add(int a, int
react和vue 基础使用对比圣京都 react react.js javascript vue.js
1.实现功能（ts）0.基础属性使用1.组件直接的通信2.useState动态修改值3.循环遍历功能4.实现类型vue的watch，filter，computed属性功能5.实现类似vue2的生命周期5.类型vuev-if功能的实现2.文件结构图3.具体代码interface.tsimport"./index.less";import{message}from"antd";import{useSt
Unity 扩展方法程序员也有头发 Unity开发 unity 游戏引擎游戏程序
比如我们要给transform做还原方法publicstaticclassExtensionMethod{publicstaticvoidResetTransformation(thisTransformtrans){trans.position=Vector3.zero;trans.localRotation=Quaternion.identity;trans.localScale=Vector
.net 插件式开发——实现web框架中大数据算法嵌入(BP算法逼近) weixin_34219944 json 人工智能
关于算法的引入：插件式架构设计，可移植性强，利于算法的升级。【插件式开发相关资料】https://www.cnblogs.com/lenic/p/4129096.html以BP算法为例：1、首先定义一个接口规范////////插件的统一入口///publicinterfaceIPluginPerfrom{//////统一算法插件入口//////输出参数的个数///输出参数///输入参数///str
Unity插件-Mirror使用方法（十四）组件介绍（KCP Transport）一颗橘子宣布成为星球 Unity Mirror网络同步框架 unity 游戏引擎
目录一、插件介绍二、主要组件NetworkManagerNetworkManagerHUDNetworkIdentityNetworkTransformNetworkAnimatorNetworkBehaviourNetworkStartPositionNetworkRoomManagerNetworkRoomPlayerNetworkDiscoveryNetworkAuthenticators三
大模型高效优化技术全景解析：微调、量化、剪枝、梯度裁剪与蒸馏时光旅人01号人工智能剪枝算法深度学习数据挖掘人工智能
目录微调（Fine-tuning）量化（Quantization）剪枝（Pruning）梯度裁剪（GradientClipping）知识蒸馏（KnowledgeDistillation）技术对比与协同策略总结与趋势1.微调（Fine-tuning）核心思想在预训练模型（如BERT、GPT）基础上，通过领域数据调整参数，适配下游任务。方法流程预训练模型加载：加载通用模型权重（如HuggingFace
枚举的构造函数中抛出异常会怎样 bylijinnan java enum 单例
首先从使用enum实现单例说起。为什么要用enum来实现单例？这篇文章（ http://javarevisited.blogspot.sg/2012/07/why-enum-singleton-are-better-in-java.html）阐述了三个理由： 1.enum单例简单、容易，只需几行代码： public enum Singleton { INSTANCE;
CMake 教程 aigo C++
转自：http://xiang.lf.blog.163.com/blog/static/127733322201481114456136/ CMake是一个跨平台的程序构建工具，比如起自己编写Makefile方便很多。介绍：http://baike.baidu.com/view/1126160.htm 本文件不介绍CMake的基本语法，下面是篇不错的入门教程： http:
cvc-complex-type.2.3: Element 'beans' cannot have character Cb123456 spring Webgis
cvc-complex-type.2.3: Element 'beans' cannot have character Line 33 in XML document from ServletContext resource [/WEB-INF/backend-servlet.xml] is i
jquery实例:随页面滚动条滚动而自动加载内容 120153216 jquery
<script language="javascript"> $(function (){ var i = 4;$(window).bind("scroll", function (event){ //滚动条到网页头部的高度，兼容ie,ff,chrome var top = document.documentElement.s
将数据库中的数据转换成dbs文件何必如此 sql dbs
旗正规则引擎通过数据库配置器（DataBuilder）来管理数据库，无论是Oracle，还是其他主流的数据都支持，操作方式是一样的。旗正规则引擎的数据库配置器是用于编辑数据库结构信息以及管理数据库表数据，并且可以执行SQL 语句，主要功能如下。 1)数据库生成表结构信息：主要生成数据库配置文件(.conf文
在IBATIS中配置SQL语句的IN方式 357029540 ibatis
在使用IBATIS进行SQL语句配置查询时，我们一定会遇到通过IN查询的地方，在使用IN查询时我们可以有两种方式进行配置参数：String和List。具体使用方式如下： 1.String:定义一个String的参数userIds，把这个参数传入IBATIS的sql配置文件，sql语句就可以这样写： <select id="getForms" param
Spring3 MVC 笔记（一） 7454103 spring mvc bean REST JSF
自从 MVC 这个概念提出来之后 struts1.X struts2.X jsf 。。。。。这个view 层的技术一个接一个！都用过！不敢说哪个绝对的强悍！要看业务，和整体的设计！最近公司要求开发个新系统！
Timer与Spring Quartz 定时执行程序 darkranger spring bean 工作 quartz
有时候需要定时触发某一项任务。其实在jdk1.3，java sdk就通过java.util.Timer提供相应的功能。一个简单的例子说明如何使用，很简单： 1、第一步，我们需要建立一项任务，我们的任务需要继承java.util.TimerTask package com.test; import java.text.SimpleDateFormat; import java.util.Date;
大端小端转换，le32_to_cpu 和cpu_to_le32 aijuans C语言相关
大端小端转换，le32_to_cpu 和cpu_to_le32 字节序 http://oss.org.cn/kernel-book/ldd3/ch11s04.html 小心不要假设字节序. PC 存储多字节值是低字节为先(小端为先, 因此是小端), 一些高级的平台以另一种方式(大端)
Nginx负载均衡配置实例详解 avords
[导读] 负载均衡是我们大流量网站要做的一个东西，下面我来给大家介绍在Nginx服务器上进行负载均衡配置方法，希望对有需要的同学有所帮助哦。负载均衡先来简单了解一下什么是负载均衡，单从字面上的意思来理解就可以解负载均衡是我们大流量网站要做的一个东西，下面我来给大家介绍在Nginx服务器上进行负载均衡配置方法，希望对有需要的同学有所帮助哦。负载均衡先来简单了解一下什么是负载均衡
乱说的 houxinyou 框架敏捷开发软件测试
从很久以前，大家就研究框架，开发方法，软件工程，好多！反正我是搞不明白！这两天看好多人研究敏捷模型，瀑布模型！也没太搞明白. 不过感觉和程序开发语言差不多，瀑布就是顺序，敏捷就是循环. 瀑布就是需求、分析、设计、编码、测试一步一步走下来。而敏捷就是按摸块或者说迭代做个循环，第个循环中也一样是需求、分析、设计、编码、测试一步一步走下来。也可以把软件开发理
欣赏的价值——一个小故事 bijian1013 有效辅导欣赏欣赏的价值
　　第一次参加家长会，幼儿园的老师说："您的儿子有多动症，在板凳上连三分钟都坐不了，你最好带他去医院看一看。"　　回家的路上，儿子问她老师都说了些什么，她鼻子一酸，差点流下泪来。因为全班30位小朋友，惟有他表现最差；惟有对他，老师表现出不屑，然而她还在告诉她的儿子："老师表扬你了，说宝宝原来在板凳上坐不了一分钟，现在能坐三分钟。其他妈妈都非常羡慕妈妈，因为全班只有宝宝
包冲突问题的解决方法 bingyingao eclipse maven exclusions 包冲突
包冲突是开发过程中很常见的问题：其表现有： 1.明明在eclipse中能够索引到某个类，运行时却报出找不到类。 2.明明在eclipse中能够索引到某个类的方法，运行时却报出找不到方法。 3.类及方法都有，以正确编译成了.class文件，在本机跑的好好的，发到测试或者正式环境就抛如下异常： java.lang.NoClassDefFoundError: Could not in
【Spark七十五】Spark Streaming整合Flume-NG三之接入log4j bit1129 Stream
先来一段废话：实际工作中，业务系统的日志基本上是使用Log4j写入到日志文件中的，问题的关键之处在于业务日志的格式混乱，这给对日志文件中的日志进行统计分析带来了极大的困难，或者说，基本上无法进行分析，每个人写日志的习惯不同，导致日志行的格式五花八门，最后只能通过grep来查找特定的关键词缩小范围，但是在集群环境下，每个机器去grep一遍，分析一遍，这个效率如何可想之二，大好光阴都浪费在这上面了
sudoku solver in Haskell bookjovi sudoku haskell
这几天没太多的事做，想着用函数式语言来写点实用的程序，像fib和prime之类的就不想提了（就一行代码的事），写什么程序呢？在网上闲逛时发现sudoku游戏，sudoku十几年前就知道了，学生生涯时也想过用C/Java来实现个智能求解，但到最后往往没写成，主要是用C/Java写的话会很麻烦。现在写程序，本人总是有一种思维惯性，总是想把程序写的更紧凑，更精致，代码行数最少，所以现
java apache ftpClient bro_feng java
最近使用apache的ftpclient插件实现ftp下载，遇见几个问题，做如下总结。 1. 上传阻塞，一连串的上传，其中一个就阻塞了，或是用storeFile上传时返回false。查了点资料，说是FTP有主动模式和被动模式。将传出模式修改为被动模式ftp.enterLocalPassiveMode();然后就好了。看了网上相关介绍，对主动模式和被动模式区别还是比较的模糊，不太了解被动模
读《研磨设计模式》-代码笔记-工厂方法模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * 工厂方法模式：使一个类的实例化延迟到子类 * 某次，我在工作不知不觉中就用到了工厂方法模式（称为模板方法模式更恰当。2012-10-29）： * 有很多不同的产品，它
面试记录语 chenyu19891124 招聘
或许真的在一个平台上成长成什么样，都必须靠自己去努力。有了好的平台让自己展示，就该好好努力。今天是自己单独一次去面试别人，感觉有点小紧张，说话有点打结。在面试完后写面试情况表，下笔真的好难，尤其是要对面试人的情况说明真的好难。今天面试的是自己同事的同事，现在的这个同事要离职了，介绍了我现在这位同事以前的同事来面试。今天这位求职者面试的是配置管理，期初看了简历觉得应该很适合做配置管理，但是今天面
Fire Workflow 1.0正式版终于发布了 comsci 工作 workflow Google
Fire Workflow 是国内另外一款开源工作流，作者是著名的非也同志，哈哈.... 官方网站是 http://www.fireflow.org 经过大家努力,Fire Workflow 1.0正式版终于发布了正式版主要变化: 1、增加IWorkItem.jumpToEx(...)方法，取消了当前环节和目标环节必须在同一条执行线的限制，使得自由流更加自由 2、增加IT
Python向脚本传参 daizj python 脚本传参
如果想对python脚本传参数，python中对应的argc, argv(c语言的命令行参数)是什么呢？需要模块：sys 参数个数：len(sys.argv) 脚本名： sys.argv[0] 参数1： sys.argv[1] 参数2： sys.argv[
管理用户分组的命令gpasswd dongwei_6688 passwd
NAME： gpasswd - administer the /etc/group file SYNOPSIS： gpasswd group gpasswd -a user group gpasswd -d user group gpasswd -R group gpasswd -r group gpasswd [-A user,...] [-M user,...] g
郝斌老师数据结构课程笔记 dcj3sjt126com 数据结构与算法
<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<
yii2 cgridview加上选择框进行操作 dcj3sjt126com GridView
页面代码 <?=Html::beginForm(['controller/bulk'],'post');?> <?=Html::dropDownList('action','',[''=>'Mark selected as: ','c'=>'Confirmed','nc'=>'No Confirmed'],['class'=>'dropdown',])
linux mysql fypop linux
enquiry mysql version in centos linux yum list installed | grep mysql yum -y remove mysql-libs.x86_64 enquiry mysql version in yum repositoryyum list | grep mysql oryum -y list mysql* install mysq
Scramble String hcx2013 String
Given a string s1, we may represent it as a binary tree by partitioning it to two non-empty substrings recursively. Below is one possible representation of s1 = "great":
跟我学Shiro目录贴 jinnianshilongnian 跟我学shiro
历经三个月左右时间，《跟我学Shiro》系列教程已经完结，暂时没有需要补充的内容，因此生成PDF版供大家下载。最近项目比较紧，没有时间解答一些疑问，暂时无法回复一些问题，很抱歉，不过可以加群（334194438/348194195）一起讨论问题。 ----广告-----------------------------------------------------
nginx日志切割并使用flume-ng收集日志 liyonghui160com
nginx的日志文件没有rotate功能。如果你不处理，日志文件将变得越来越大，还好我们可以写一个nginx日志切割脚本来自动切割日志文件。第一步就是重命名日志文件，不用担心重命名后nginx找不到日志文件而丢失日志。在你未重新打开原名字的日志文件前，nginx还是会向你重命名的文件写日志，linux是靠文件描述符而不是文件名定位文件。第二步向nginx主
Oracle死锁解决方法 pda158 oracle
　select p.spid,c.object_name,b.session_id,b.oracle_username,b.os_user_name from v$process p,v$session a, v$locked_object b,all_objects c where p.addr=a.paddr and a.process=b.process and c.object_id=b.
java之List排序 shiguanghui list排序
在Java Collection Framework中定义的List实现有Vector，ArrayList和LinkedList。这些集合提供了对对象组的索引访问。他们提供了元素的添加与删除支持。然而，它们并没有内置的元素排序支持。　　你能够使用java.util.Collections类中的sort()方法对List元素进行排序。你既可以给方法传递
servlet单例多线程 utopialxw 单例多线程 servlet
转自http://www.cnblogs.com/yjhrem/articles/3160864.html 和 http://blog.chinaunix.net/uid-7374279-id-3687149.html Servlet 单例多线程 Servlet如何处理多个请求访问？Servlet容器默认是采用单实例多线程的方式处理多个请求的：1.当web服务器启动的