Greepex

GAN学习之路（五）：Mask-Guided Portrait Editing withcGANs

文章目录

1. 相关概念

1.1 Portrait Editing
1.2 cGAN
1.3 MASK（掩膜）

2.文章idea
3. 三个子网络实现

3.1 局部嵌入子网络
3.2 掩膜引导生成子网络
3.3 背景融合子网络

4. 实验细节

4.1 训练策略
4.2 训练细节
4.2 实验结果

我们先看一下论文题目Mask-Guided Portrait Editing with CGAN，使用cGAN来进行掩膜引导的肖像编辑。肖像编辑是最终的目的，掩膜和cGAN是手段。

1. 相关概念

1.1 Portrait Editing

肖像编辑是图像处理里的热门话题，我的理解就是对人脸或者人脸的某一部分（鼻子、眼睛等等）进行处理，处理的手段包括美化、替换等等。肖像编辑由于其在电影、游戏、照片处理和共享等方面的潜在应用，在视觉和图形领域引起了广泛的关注。人们想获得让脸看起来更有趣、更有趣、更美丽的魔力。

1.2 cGAN

条件生成对抗网络是一种非常实用且流行的网络，比较详细的介绍在这里。虽然条件生成对抗网络能够生成人脸，但细节之处非常不真实。为了解决这个问题，一种可能的解决方案是使用掩膜来引导生成。一方面，掩膜提供了良好的积核约束，这有助于合成比较真实的轮廓。

1.3 MASK（掩膜）

MASK在深度学习是指图像分割的一个结果。图片中有个圆形物体，我们从纸上剪掉一个和该物体一模一样大小的圆，将这张纸蒙在图片中，也就是MASK。掩膜用于帮助在学习中为每个组件指定区域，为源图像和目标图像建立了组件级的对应。

2.文章idea

肖像编辑框架主要由三部分组成:局部嵌入子网络、掩码引导生成子网络和背景融合子网络，这三个子网络都是端到端的网络。

局部嵌入子网络：局部嵌入自网络包含五个自编码器，分别对应五个面部分量：左眼、右眼、嘴、皮肤（鼻子）、头发。
掩膜引导生成子网络：掩模引导生成子网络将局部嵌入的片段与目标掩膜重新组合在一起，生成前景人脸图像。掩膜用于帮助在学习中为每个组件指定区域。
背景融合子网络：主要负责融合背景和前景人脸，根据目标人脸掩膜生成自然的人脸图像。

掩膜会帮助所有三个子网络的面部生成。有了掩膜，作者的框架可以应用在很多地方，如下图a，作者可以在掩码的引导下生成新的面孔，而在下图b中，作者则改变了局部的一些特征，比如嘴等等；图c中作者则展示该边所有局部特征的一个生成结果。

综上所述：

文章提出了一种基于掩模引导的条件生成对抗网络(cGANs)的新框架，成功地解决了人脸合成中的多样性、质量和可控性问题。
该框架是通用的，可用于大量应用程序，如掩膜合成人脸、肖像编辑、人脸交换等等。

3. 三个子网络实现

下图是三个自网络的示意图：
损失函数是由最后的蓝色框线输出部分。

3.1 局部嵌入子网络

如上图的Local Embedding Sub-Network部分，我们首先将人脸 $x^{s}$ 输入 $P_F$ 网络中以获得掩膜 $m^s$ （ $P_F$ 是一个全卷积网络，使用Helen数据集训练，能够生成人脸掩膜的网络）。之后根据人脸掩膜，我们将人脸分为五部分 $x_i^s$ 其中i={0,1,2,3,4}，分别表示{“左眼”,“右眼”,“嘴”,“皮肤和鼻子”,“头发”}五部分，对于每一部分，我们使用相应的自编码器网络{ $E_{local}^i$ , $G_{local}^i$ }。
利用五种自编码器网络，我们可以方便地改变生成的人脸图像中的任何一个面部成分，或重组来自不同面部的不同成分。
损失函数：
在该网络中，我们使用了 $L_{local}$ 损失函数来对 $E_{local}$ 进行约束：
$L_{local}=\frac{1}{2}{||x_i^s - G_{local}^i(E_{local}^i(x_i^s))||}_2^2$
其原理和自编码器一模一样，就是为了保持输入和输出相同。

3.2 掩膜引导生成子网络

这个网络主要负责将局部嵌入自网络 $E_{local}^i$ 生成的人脸五部分特征 $x_i^s$ 以及目标掩膜特征张量融合在一起。其中，掩膜特征张量是目标掩膜 $m^t$ 经过编码器 $E_m$ 输出的结果。掩膜引导生成子网络分为以下几步：

从目标掩膜 $x^t$ （我个人觉得应该是 $m^t$ ，但原文是 $x^t$ ）中获取五个分量的中心位置 ${c_i\}_{i=1,2,3,4,5}$ ；
准备五个3D张量，所有的张量使用0填充， $\{\hat f_i\}_{i=1...5}$ ，每个张量的高宽与掩膜特征张量相同，和每个部分的组件的通道数相同；
我们根据五个分量的中心位置 ${c_i\}_{i=1,2,3,4,5}$ ，将人脸五部分特征 $x_i^s$ 分别放在五个新建张量 $\{\hat f_i\}_{i=1...5}$ 的相应位置上；
我们将所有的3D张量和目标掩膜特征张量拼接起来得到一个融合后的张量；
最后，我们将融合后的张量输入到 $G_m$ 中来生成前景图像。

3.3 背景融合子网络

将生成的前景面粘贴到目标图像的背景中，最直接的方法是从目标图像 $x^t$ 中复制背景，然后根据目标口罩将其与前景面结合起来。但这样会导致前景和背景的边界非常明显，可能的原因有二：

颈部皮肤存在于肖像背景中，我们可能融合得到的图像会有肤色的不同；
掩膜得到的结果不一定很完美，也许会有头发残存于背景中。

为了解决这个问题，我们就创造了背景融合子网络，步骤如下：

使用掩膜解析网络 $P_F$ 得到肖像背景部分；
将背景部分输入到编码器 $E_b$ 中来得到背景部分的特征张量；
将背景部分特征张量与前景人脸肖像部分拼接，输入到生成网络 $G_b$ 中，得到最终的结果。

损失函数：
在该网络中，我们使用了 $L_{global}$ 、 $L_{GP}$ 、 $L_{GD}$ 损失函数来进行约束，：

$L_{global}=\frac{1}{2}{||G(x^s,m^s,x^t,m^t)-x^s||}_2^2$ ，这里的 $G(x^s,m^s,x^t,m^t)$ 就是我们最终的输出（也是背景融合子网络的输出），而 $x^s$ 是我们的源输入图像；
从论文题目可以看出，论文提出的网络要使用cGAN，于是就在这里，我们将详细解释cGAN是如何使用在本项目中。论文使用了Pix2PixHD的多尺度判别器（目测是指两个判别器这样，我会在文后进行详细解释），这里的条件生成网络的条件是指 $m^t$ ，那么，两个判别器的损失函数为： $L_{D_i}=-E_{x^t\sim P_r}[logD_i(x^t,m^t)]-E_{x^t,x^s\sim P_r}[log(1-D_i(G(x^s,m^s,x^t,m^t),m^t))]$ ，生成器G的损失函数为 $L_{sigmoid}=-E_{x^t,x^s\sim P_r}[log(D_i(G(x^s,m^s,x^t,m^t),m^t))]$ ；由于原始的生成器G损失可能会导致梯度不稳定的问题，因此，作者还提出了分类器D在最后一层输出的特征层表示为 $f_{D_i}(x^t,m^t)$ ，那么作者提出了特征匹配损失（feature matching loss）为 $L_{FM}=\frac{1}{2}{||f_{D_i}(G(x^s,m^s,x^t,m^t),m^t)-f_{D_i}(x^t,m^t)||}_2^2$ 因此，G最终的输出为 $L_{GD}=L_{sigmoid}+\lambda_{FM}L_{FM}$ 。
我们之前提到了一个全卷积网络 $P_F$ 用来进行语义分割，这个网络本质是U-Net网络，也就是自编码器结合跳跃连接，它是在Helen人脸数据集上进行训练，其中的损失函数为 $L_P = -E_{x\sim P_r}[\sum_{i,j}logP(p_{i,j}|P_F(x)_{i,j})]$ ，这里的(i,j)是指相应位置的像素。在经过Helen人脸数据集后，我们希望最终生成的人脸经过 $P_F$ 后可以与目标掩膜一样，那么最终的损失函数为 $L_{GP}=-E_{x\sim P_r}[\sum_{i,j}P(M_{i,j}^t|P_F(G(x^s,m^s,x^t,m^t))_{i,j})]$

最终的生成模型G的损失函数为：、
$L_G=\lambda_{local}L_{local}+\lambda_globalL_{global}+\lambda_{GD}L_{GD}+\lambda_{GP}L_{GP}$ ，在作者的论文指出，实验中 $\lambda_{local},\lambda_{global},\lambda_{GD},\lambda_{GP}=\{10,1,1,1\}$

4. 实验细节

4.1 训练策略

$m^s$ 和 $m^t$ 是 $x^s$ 和 $x^t$ 通过 $P_F$ 得到，因此网络的输入其实是 $x^s$ 和 $x^t$ 。论文借鉴了自编码器的思想，论文需要两种类型的输入：

匹配数据：一种是 $x^s$ 和 $x^t$ 是同一幅图像；对于匹配数据，我们使用全部的 $L_G$ 损失
非匹配数据：一种是 $x^s$ 和 $x^t$ 不是同一幅图像；对于非匹配数据，我们将 $\lambda_{global}$ 和 $\lambda_{FM}$ 设置为0。

这两种输入交替输入，输入一次匹配数据，再输入一次非匹配数据，交替进行。

4.2 训练细节

我们使用Helen数据进行 $P_F$ 的训练以及评估。Helen数据集包括2330张人脸数据（2000张训练集，330张测试集）。但由于2000张人脸图像的有效性有限，因此我们首先使用这2000张人脸图像来训练解析网络 $P_F$ ，然后使用解析网络从VGGFace2获得额外的20000张人脸图像的语义掩码。在实验过程中，我们总共使用了22000张人脸图像进行训练。解析网络具体训练过程如下：

使用JDA人脸检测器检测面部区域；
定位五个面部标志（两只眼睛、鼻尖和两个嘴角）；
作者使用了基于面部标志的相似变换将人脸对齐到一个规范位置；
裁剪出一个256x256的面部区域来做试验；

在作者的实验中，五个张量(左眼、右眼、嘴、皮肤和头发)的输入大小由每个组件的最大大小决定。因此在实验中作者使用48x32，48x32，144x80，256x256，256x256的大小来表示左眼、右眼、嘴、皮肤和头发。

上图是论文作者提出的网络与Pix2PixHD以及bicycleGAN进行对比的结果，Pixel2PixHD以及bicycleGAN的输入是掩膜（traget mask），而作者的网络输入是（source image和target image）。

4.2 实验结果

如上图，掩膜右边是实验的生成的结果，第一列是target image，第二列是traget mask。

当然，本论文同时支持两种肖像编辑：

改变人脸的某一部分的掩膜，如上图的前两行；
将其他人脸的某一部分掩膜组件替换本人脸的一部分，如下面两行；

上图第一列是输入图像和输入的掩膜，第二列分别将胡子添加和改变头发，第三列改变嘴唇和改变眼妆。

上图是两张图像进行了一个交换，也就是两张图像分别为 $x^t$ 和 $x^s$ 的时候。

上图第一列是 $x^t$ ，第二列是 $x^s$ ，第三列是输出。

你可能感兴趣的:(Pytorch论文复现)

【缺陷检测】基于计算机视觉实现电路板智能检测系统附Matlab代码 matlab科研助手计算机视觉 matlab 人工智能
✅作者简介：热爱科研的Matlab仿真开发者，擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。往期回顾关注个人主页：Matlab科研工作室个人信条：格物致知,完整Matlab代码及仿真咨询内容私信。内容介绍随着信息技术的飞速发展和电子产品的日益普及，印刷电路板（PCB）作为电子产品的核心组件，其质量直接关系到整个系统的性能和可靠性。传统的电路板检测主要依赖人工目检，存在效率低下
[论文阅读] 人工智能 + 软件工程 | 单会话方法论：一种以人类为中心的人工智能辅助软件开发协议张较瘦_ 前沿技术论文阅读人工智能软件工程
单一对话法（SCM）：AI辅助软件开发的“全局对话”新思路SingleConversationMethodology:AHuman-CenteredProtocolforAI-AssistedSoftwareDevelopmentarXiv:2507.12665SingleConversationMethodology:AHuman-CenteredProtocolforAI-AssistedSo
论文阅读：LLaVA1.5：Improved Baselines with Visual Instruction Tuning 微风❤水墨 LLM &AIGC &VLP LLM
论文：https://arxiv.org/abs/2310.03744代码：https://github.com/haotian-liu/LLaVA#train微调：https://github.com/haotian-liu/LLaVA/blob/main/docs/Finetune_Custom_Data.md模型论文时间VisionEncoderVLAdapterProjectionLaye
PyTorch生成式人工智能（18）——循环神经网络详解与实现盼小辉丶 pytorch rnn 自然语言处理
PyTorch生成式人工智能（18）——循环神经网络详解与实现0.前言1.文本生成的挑战2.循环神经网络2.1文本数据2.2循环神经网络原理3.长短期记忆网络3.自然语言处理基础3.1分词3.2词嵌入3.3词嵌入在自然语言处理中的应用小结系列链接0.前言我们已经学习了如何生成数字和图像等内容。从本节开始，我们将主要聚焦于文本生成。人类语言极其复杂且充满细微差别，不仅仅涉及语法和词汇的理解，还包括上
Deep Multi-scale Convolutional Neural Network for Dynamic Scene Deblurring 论文阅读钟屿论文阅读计算机视觉人工智能
用于动态场景去模糊的深度多尺度卷积神经网络摘要针对一般动态场景的非均匀盲去模糊是一个具有挑战性的计算机视觉问题，因为模糊不仅来源于多个物体运动，还来源于相机抖动和场景深度变化。为了去除这些复杂的运动模糊，传统的基于能量优化的方法依赖于简单的假设，例如模糊核是部分均匀或局部线性的。此外，最近的基于机器学习的方法也依赖于在这些假设下生成的合成模糊数据集。这使得传统的去模糊方法在模糊核难以近似或参数化的
基于Paillier同态加密算法的金融数据安全共享机制研究【附数据】
金融数据分析与建模专家金融科研助手|论文指导|模型构建✨专业领域：金融数据处理与分析量化交易策略研究金融风险建模投资组合优化金融预测模型开发深度学习在金融中的应用擅长工具：Python/R/MATLAB量化分析机器学习模型构建金融时间序列分析蒙特卡洛模拟风险度量模型金融论文指导内容：金融数据挖掘与处理量化策略开发与回测投资组合构建与优化金融风险评估模型期刊论文✅具体问题可以私信或查看文章底部二维码
为什么用Pytorch帮客户训练好了模型还要提供模型结构？ yuanpan pytorch 人工智能机器学习
如果我在训练模型后生成好了一个模型文件：mnist_model.pth我想把这个模型文件给第三方使用，而不告诉他模型定义的结构等信息，那么第三方是不是就用不起来这个模型？答案：是的。如果只提供.pth文件而不告知模型结构，第三方确实无法直接使用该模型。原因和解决方案如下：1.为什么无法直接使用？.pth文件仅保存参数：torch.save(model.state_dict(),'mnist_mod
autodl云计算平台使用ollama 部署lightrag 加入streamlit界面 42fourtytoo 云计算深度学习 pytorch 学习
1到autodl的算力市场里开一台机器镜像选择：PyTorch2.3.0、Python3.12(ubuntu22.04)、Cuda12.1我本来选择的Cuda12.4，但版本过高疑似会使ollama不使用GPU而只用CPU，后来换个镜像就好了2下载lightrag从lightrag的GitHub界面下载zip开机，上传zip，解压到autodl-tmp/lightrag下安装依赖，在文件夹下：pi
我过了把论文答辩的瘾珍惜心理
我于八十年代末大专毕业，此后通过函授拿到本科文凭，没有过论文答辩关，所以对这高大上的论文答辩一无所知。2019年9月进入韦志中心理学网校学习，得知要取得中级证书，需提交一篇3000—5000字的论文，并要通过论文答辩。我教中学语文三十年，为了评职称，也曾写过几十篇教学论文，并获各种奖项，也在不同刊物发了几篇，但那些论文不过一二千字，浅尝辄止，从没经过论文答辩，心里还是有点怯怯的。2020年初突如其
iOS WebView 调试实战页面跳转失效与历史记录错乱的排查路径 2501_92835650 ios
在混合开发中，Web页面通过WebView承载后，经常会遇到这样的问题：点击跳转没有反应、历史记录错乱、后退页面空白，甚至浏览器里的history.back()无效。这些问题在浏览器调试时很难复现，却在iOSWebView容器中频繁出现。本文基于一个真实案例，拆解iOSWebView中涉及页面跳转的核心机制、调试路径与协同流程，并结合调试工具实践，包括WebDebugX在其中所完成的关键观察任务。
AI驱动型论文搜索工具司南锤 AI 工具
✅一、AI驱动型论文搜索工具（强烈推荐）1.Consensus官网：consensus.app特点：输入自然语言问题（如“Doesgreenspacereduceurbanheatislandeffect?”），系统会自动返回论文中直接回答该问题的句子，标明支持/不支持的证据。适合人群：科研人员、政策制定者、想快速得到文献共识的人。2.ScispaceCopilot（原SemanticSchola
【计算机毕业设计】基于SSM+Vue的游戏攻略网站系统【源码+lw+部署文档+讲解】
目录1绪论1.1研究背景1.2目的和意义1.3论文结构安排2相关技术2.1SSM框架介绍2.2B/S结构介绍2.3Mysql数据库介绍3系统分析3.1系统可行性分析3.1.1技术可行性分析3.1.2经济可行性分析3.1.3运行可行性分析3.2系统性能分析3.2.1易用性指标3.2.2可扩展性指标3.2.3健壮性指标3.2.4安全性指标3.3系统流程分析3.3.1操作流程分析3.3.2登录流程分析3
【乳腺超声、乳腺钼靶、宫颈癌、CT骨折】等项目数据调研，及相关参考内容整理汇总钱多多先森人工智能（AI）医学影像深度学习乳腺钼靶乳腺超声宫颈癌
文章目录一、乳腺超声内容整理1.1、数据集1.2、可以参考的论文1.3、可以参考的GitHub代码1.4、可以参考的博客1.5、简单任务需求二、宫颈癌风险智能诊断2.1、数据集2.2、KFB读取文件显示三、乳腺钼靶3.1、数据集3.2、拍摄方式：3.3、拍摄和观察视图3.4、DDSM标注文件解析四、CT骨折4.1、数据集五、总结本博客是一个笔记类的记录文档，主要是记录了在调研各个项目的过程中，遇到
基于STM32的智能花盆浇水系统毕业设计看，是大狗 stm32 课程设计嵌入式硬件
目录单片机毕业设计论文前言单片机毕业设计功能介绍设计视频演示单片机毕业设计论文前言随着城市化进程的加快和人们生活水平的提高，越来越多的人开始在家中种植植物，以美化环境、净化空气和陶冶情操。然而，由于工作繁忙或缺乏种植经验，许多人难以对植物进行及时、适量的浇水，导致植物生长不良甚至死亡。传统的花盆浇水方式依赖人工操作，存在效率低下、难以精准控制水量等问题，无法满足现代家庭对植物养护的智能化需求。近年
基于STM32的语音播报小项目课程设计程序开源看，是大狗 stm32 开源嵌入式硬件
目录单片机毕业设计论文前言单片机毕业设计功能介绍设计视频演示单片机课程设计设计论文前言随着科技的飞速发展和智能化时代的到来，人们对环境监测的需求日益增加，尤其是在温度监测方面，精准、实时的温度数据对于工业生产、农业生产以及日常生活都具有重要意义。传统的温度监测系统往往功能单一，缺乏实时反馈和智能化处理能力，难以满足现代应用场景的需求。近年来，嵌入式系统、传感器技术和语音交互技术的快速发展，为温度监
opencv、torch、torchvision、tensorflow的区别
一、框架定位与核心差异PyTorch动态计算图：实时构建计算图支持Python原生控制流（如循环/条件），调试便捷。学术主导：2025年工业部署份额24%，适合快速原型开发（如无人机自动驾驶、情绪识别）。TensorFlow静态计算图优化：预编译图结构提升部署效率支持动态图（Eager模式）兼顾灵活性。工业部署首选：市场份额38%，擅长边缘计算（YOLO部署）和大规模项目（工业自动化）-59）。O
甘肃省天水市13家亲子鉴定中心大全(附2024年9月汇总鉴定) 鼎律基因刘主任
宗旨：在提高亲子鉴定咨询结果的准确性和真实性，为每一位受检客户得到一个公平、公证、真实、可靠的咨询结果，长期关注国内亲子鉴定师编写论文，从而确保提供实时亲子鉴定解答，是我们作为一家有责任心企业的标准的原则。实验室实力：配备了多套高端实验设备，包括美国AB公司3500XL遗传分析仪、9700金座PCR扩增仪、普洛麦格公司超精确检测系统PP21+PPY23，准确度高达99.9999%超高精确试剂盒等，
PyTorch笔记6----------神经网络案例 HuashuiMu花水木 PyTorch笔记 pytorch 笔记
1.回归网络波士顿房价预测模型搭建波士顿房价数据集下载链接：百度网盘请输入提取码提取码:5279导入所需包importtorchimportnumpyasnpimportre读取数据ff=open('housing.data').readlines()data=[]foriteminff:out=re.sub(r"\s{2,}","",item).strip()#通过正则表达式去除所有空格data
法学本科毕业论文什么选题方向好写？专科、本科都能看
加文末微信，获取论文服务：专科、本科、专升本；自考、函授、成教、国开、网教、成人专升本；全学科1对1咨询，承接各种论文辅导帮助；扫描文末，专业老师1v1论文服务。法学本科毕业论文什么选题方向好写？专科、本科都能看法学专业的本科毕业论文写作中，选题是一个关键步骤，它直接影响到论文的质量和研究的深度。如果你还在为选题而苦恼，不妨参考一下师哥师姐的经验，他们的研究方向往往能为你提供有价值的参考和启示。本
【AI 赋能：Python 人工智能应用实战】5. 梯度下降家族：SGD/Adam优化器对比实验与选择策略 AI_DL_CODE 人工智能 python 梯度下降优化器 SGD Adam PyTorch
摘要：本文系统解析梯度下降优化器的核心原理与演进脉络，构建从理论到实战的完整知识体系。理论部分梳理优化器发展里程碑，从1951年的SGD到2018年的AdamW，揭示技术迭代逻辑；通过数学公式对比SGD、Momentum、Adam等核心算法的更新机制，解析动量加速、自适应学习率的创新点。结合损失曲面分析，阐释Momentum如何逃离鞍点、Adam如何处理悬崖梯度。实战模块基于PyTorch在MNI
[论文]基于强化学习的控制输入非线性水下机器人自适应神经网络控制王莽v2 机器人神经网络神经网络算法控制器
[论文]基于强化学习的控制输入非线性水下机器人自适应神经网络控制摘要本文研究了在水平面内运动的全驱动自主水下机器人的轨迹跟踪问题。在我们的控制设计中考虑了外部干扰、控制输入非线性和模型不确定性。基于离散时间域的动力学模型，两个神经网络(包括一个临界神经网络和一个作用神经网络)被集成到我们的自适应控制设计中。引入临界神经网络来评价设计的控制器在当前时间步长内的长期性能，并利用作用神经网络来补偿未知动
使用UV管理PyTorch项目
PyTorch是深度学习研究和开发的流行选择。可以使用uv管理PyTorch项目，包括不同Python版本依赖、管理环境、甚至加速器选择等。安装Pytorch从打包角度来看，PyTorch有几个不常见的特点：许多PyTorchwheel托管在专门的索引上，而非Python包索引（PyPI）。因此，安装PyTorch通常需要配置项目使用PyTorch专属索引。PyTorch为每种加速器生成不同的构建
内网渗透—横向移动&NTLM-Relay重放攻击&Responder中继攻击
前言与NLTM认证相关的安全问题主要有PassTheHash、利用NTLM进行信息收集、Net-NTLMHash破解、NTLMRelay几种。PTH前往期文章复现，运用mimikatz、impacket工具包的一些脚本、CS等等都可以利用，NTLMRelay又包括（relaytosmb,ldap,ews）可以应用在获取不到明文或HASH时采用的手法，但也要注意手法的必备条件。实验环境实验环境没有固
模型移植实战：从PyTorch到ONNX完整指南慕婉0307 神经网络 pytorch 人工智能 python
一、认识ONNXONNX（OpenNeuralNetworkExchange）是一种开放的模型表示格式，由微软和Facebook（现Meta）在2017年共同推出，旨在解决深度学习模型在不同框架之间的互操作性问题。ONNX的主要优势包括：跨框架兼容性：支持主流深度学习框架间的模型转换，包括PyTorch、TensorFlow、MXNet、CNTK等例如，可以将PyTorch训练的ResNet模型导
【舰艇控制】基于matlab具有不确定性和扰动的水面舰艇的自适应有限时间平滑非线性滑模跟踪控制【含Matlab源码 13748期】复现含文献海神之光 Matlab路径规划（进阶版）matlab
欢迎来到海神之光博客之家✅博主简介：热爱科研的Matlab仿真开发者，修心和技术同步精进；个人主页：海神之光代码获取方式：海神之光Matlab王者学习之路—代码获取方式Matlab毕设：Matlab毕设系列–说明期刊发表：发表北大核心，SCI不是梦！！⛳️座右铭：行百里者，半于九十。更多Matlab路径规划仿真内容点击①Matlab路径规划（进阶版）②付费专栏Matlab路径规划（初级版）⛳️关注
PyTorch的基础概念和复杂模型的基本使用香蕉可乐荷包蛋 AI大模型项目中的使用 pytorch 人工智能 python
文章目录一、PyTorch基础概念二、复杂模型的学习使用一、PyTorch基础概念张量（Tensor）操作：张量是PyTorch中的基本数据结构，类似于NumPy的数组，但支持GPU加速常见操作包括创建张量、张量运算、索引、切片等importtorch#创建张量x=torch.randn(3,4)y=torch.zeros(3,4)#张量运算z=x+y自动求导（Autograd）：PyTorch的
三篇AAAI顶级论文带你一键搞懂多模态！
关注gongzhonghao【计算机sci论文精选】！拿捏更多顶会顶刊发文资讯随着人工智能技术的飞速发展，多模态学习逐渐成为研究热点。多模态技术能够整合文本、图像、语音等多种模态的信息，为人工智能的应用带来了更丰富的语义理解和更强大的交互能力。此外，多模态技术在视频和语言任务中的应用也取得了显著进展。这些技术不仅提升了模型的性能，还为人工智能在更多领域的应用提供了新的可能性。今天小图给大家精选3篇
python3.9安装tensorflow-gpu 2.6.0和torch-gpu版本各依赖包的版本对应关系
首先使用的cuDNN（8.1）、CUDA（11.2）、tensorflow-gpu（2.6.0）、python（3.9）之间对应版本Window环境下安装pytorch下载地址tensorflow官网CUDA下载官网cuDNN下载官网注意：cuDNN需要注册absl-py0.15.0astunparse1.6.3cachetools5.3.2certifi2023.7.22charset-norm
短文完结版☞【重生后，我打脸渣男狗女】唐秋苏渺渺☞【重生后，我打脸渣男狗女】一口气读完！妞妞爱读书1
前世，我苦心研究了三年的科研成果却被男友的学妹举报抄袭。只因我们的sci论文完全相同，但她却比我还要提早发表。铁板钉钉的证据面前，我无力反驳，被网络暴力。甚至有极端网友破坏了我家的电线导致短路失火，让我父母葬身火海。我因此患上了抑郁症，割喉自杀。再睁眼，我回到了发表论文的前一天。我睁开眼睛，映入眼帘的是电脑屏幕上即将完成的sci论文。“唐秋你实在是太棒了!"“你居然真的研究出了常温下的超导材料，这
「感恩日语」2021-303篇，吸渣体质能学多少学多少
学习感悟，避免成为“吸渣”体质很重要，“环境”能改变人，学会甄别那些“书籍”、那些“文章”（论文）对自己成长有利，而非“奶头乐”系统算法之类推送的让自己无法自拔的内容，个人每天、每周、每月、每年、一生总时间是有限的，缩小到每天，计算一下每天浪费有多少，真正发挥价值时间效力有多少，简单做个记录，会发现很可怕。同时找到了为什么每天进步一点点的重要性，只跟昨天的自己，前天的自己比较一下，很重要，多做对自
tomcat基础与部署发布暗黑小菠萝 Tomcat java web
从51cto搬家了，以后会更新在这里方便自己查看。做项目一直用tomcat，都是配置到eclipse中使用，这几天有时间整理一下使用心得，有一些自己配置遇到的细节问题。 Tomcat：一个Servlets和JSP页面的容器，以提供网站服务。一、Tomcat安装安装方式：①运行.exe安装包 &n
网站架构发展的过程 ayaoxinchao 数据库应用服务器网站架构
1.初始阶段网站架构：应用程序、数据库、文件等资源在同一个服务器上 2.应用服务和数据服务分离：应用服务器、数据库服务器、文件服务器 3.使用缓存改善网站性能：为应用服务器提供本地缓存，但受限于应用服务器的内存容量，可以使用专门的缓存服务器，提供分布式缓存服务器架构 4.使用应用服务器集群改善网站的并发处理能力：使用负载均衡调度服务器，将来自客户端浏览器的访问请求分发到应用服务器集群中的任何
[信息与安全]数据库的备份问题 comsci 数据库
如果你们建设的信息系统是采用中心-分支的模式,那么这里有一个问题如果你的数据来自中心数据库,那么中心数据库如果出现故障,你的分支机构的数据如何保证安全呢? 是否应该在这种信息系统结构的基础上进行改造,容许分支机构的信息系统也备份一个中心数据库的文件呢? &n
使用maven tomcat plugin插件debug关联源代码商人shang maven debug 查看源码 tomcat-plugin
*首先需要配置好'''maven-tomcat7-plugin'''，参见[[Maven开发Web项目]]的'''Tomcat'''部分。 *配置好后，在[[Eclipse]]中打开'''Debug Configurations'''界面，在'''Maven Build'''项下新建当前工程的调试。在'''Main'''选项卡中点击'''Browse Workspace...'''选择需要开发的
大访问量高并发 oloz 大访问量高并发
大访问量高并发的网站主要压力还是在于数据库的操作上，尽量避免频繁的请求数据库。下面简要列出几点解决方案： 01、优化你的代码和查询语句，合理使用索引 02、使用缓存技术例如memcache、ecache将不经常变化的数据放入缓存之中 03、采用服务器集群、负载均衡分担大访问量高并发压力 04、数据读写分离 05、合理选用框架，合理架构(推荐分布式架构)。
cache 服务器小猪猪08 cache
Cache 即高速缓存.那么cache是怎么样提高系统性能与运行速度呢？是不是在任何情况下用cache都能提高性能？是不是cache用的越多就越好呢？我在近期开发的项目中有所体会，写下来当作总结也希望能跟大家一起探讨探讨，有错误的地方希望大家批评指正。　　1.Cache 是怎么样工作的? 　　Cache 是分配在服务器上
mysql存储过程香水浓 mysql
Description:插入大量测试数据 use xmpl; drop procedure if exists mockup_test_data_sp; create procedure mockup_test_data_sp( in number_of_records int ) begin declare cnt int; declare name varch
CSS的class、id、css文件名的常用命名规则 agevs JavaScript UI 框架 Ajax css
CSS的class、id、css文件名的常用命名规则 (一)常用的CSS命名规则　　头：header 　　内容：content/container 　　尾：footer 　　导航：nav 　　侧栏：sidebar 　　栏目：column 　　页面外围控制整体布局宽度：wrapper 　　左右中：left right
全局数据源 AILIKES java tomcat mysql jdbc JNDI
实验目的：为了研究两个项目同时访问一个全局数据源的时候是创建了一个数据源对象，还是创建了两个数据源对象。 1：将diuid和mysql驱动包（druid-1.0.2.jar和mysql-connector-java-5.1.15.jar）copy至%TOMCAT_HOME%/lib下；2：配置数据源，将JNDI在%TOMCAT_HOME%/conf/context.xml中配置好,格式如下：&l
MYSQL的随机查询的实现方法 baalwolf mysql
MYSQL的随机抽取实现方法。举个例子，要从tablename表中随机提取一条记录，大家一般的写法就是：SELECT * FROM tablename ORDER BY RAND() LIMIT 1。但是，后来我查了一下MYSQL的官方手册，里面针对RAND()的提示大概意思就是，在ORDER BY从句里面不能使用RAND()函数，因为这样会导致数据列被多次扫描。但是在MYSQL 3.23版本中，
JAVA的getBytes()方法 bijian1013 java eclipse unix OS
在Java中，String的getBytes()方法是得到一个操作系统默认的编码格式的字节数组。这个表示在不同OS下，返回的东西不一样！ String.getBytes(String decode)方法会根据指定的decode编码返回某字符串在该编码下的byte数组表示，如： byte[] b_gbk = "
AngularJS中操作Cookies bijian1013 JavaScript AngularJS Cookies
如果你的应用足够大、足够复杂，那么你很快就会遇到这样一咱种情况：你需要在客户端存储一些状态信息，这些状态信息是跨session(会话)的。你可能还记得利用document.cookie接口直接操作纯文本cookie的痛苦经历。幸运的是，这种方式已经一去不复返了，在所有现代浏览器中几乎
[Maven学习笔记五]Maven聚合和继承特性 bit1129 maven
Maven聚合在实际的项目中，一个项目通常会划分为多个模块，为了说明问题，以用户登陆这个小web应用为例。通常一个web应用分为三个模块： 1. 模型和数据持久化层user-core, 2. 业务逻辑层user-service以 3. web展现层user-web， user-service依赖于user-core user-web依赖于user-core和use
【JVM七】JVM知识点总结 bit1129 jvm
1. JVM运行模式 1.1 JVM运行时分为-server和-client两种模式，在32位机器上只有client模式的JVM。通常，64位的JVM默认都是使用server模式，因为server模式的JVM虽然启动慢点，但是，在运行过程，JVM会尽可能的进行优化 1.2 JVM分为三种字节码解释执行方式：mixed mode, interpret mode以及compiler
linux下查看nginx、apache、mysql、php的编译参数 ronin47
在linux平台下的应用，最流行的莫过于nginx、apache、mysql、php几个。而这几个常用的应用，在手工编译完以后，在其他一些情况下（如：新增模块），往往想要查看当初都使用了那些参数进行的编译。这时候就可以利用以下方法查看。 1、nginx [root@361way ~]# /App/nginx/sbin/nginx -V nginx: nginx version: nginx/
unity中运用Resources.Load的方法？ brotherlamp unity视频 unity资料 unity自学 unity unity教程
问：unity中运用Resources.Load的方法？答：Resources.Load是unity本地动态加载资本所用的方法,也即是你想动态加载的时分才用到它,比方枪弹,特效,某些实时替换的图像什么的,主张此文件夹不要放太多东西,在打包的时分,它会独自把里边的一切东西都会集打包到一同,不论里边有没有你用的东西,所以大多数资本应该是自个建文件放置 1、unity实时替换的物体即是依据环境条件
线段树-入门 bylijinnan java 算法线段树
/** * 线段树入门 * 问题：已知线段[2,5] [4,6] [0,7]；求点2,4,7分别出现了多少次 * 以下代码建立的线段树用链表来保存，且树的叶子结点类似[i,i] * * 参考链接：http://hi.baidu.com/semluhiigubbqvq/item/be736a33a8864789f4e4ad18 * @author lijinna
全选与反选 chicony 全选
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd"> <html> <head> <title>全选与反选</title>
vim一些简单记录 chenchao051 vim
mac在/usr/share/vim/vimrc linux在/etc/vimrc 1、问：后退键不能删除数据，不能往后退怎么办？答：在vimrc中加入set backspace=2 2、问：如何控制tab键的缩进？答：在vimrc中加入set tabstop=4 (任何
Sublime Text 快捷键 daizj 快捷键 sublime
[size=large][/size]Sublime Text快捷键：Ctrl+Shift+P：打开命令面板Ctrl+P：搜索项目中的文件Ctrl+G：跳转到第几行Ctrl+W：关闭当前打开文件Ctrl+Shift+W：关闭所有打开文件Ctrl+Shift+V：粘贴并格式化Ctrl+D：选择单词，重复可增加选择下一个相同的单词Ctrl+L：选择行，重复可依次增加选择下一行Ctrl+Shift+L：
php 引用(&)详解 dcj3sjt126com PHP
在PHP 中引用的意思是：不同的名字访问同一个变量内容. 与Ｃ语言中的指针是有差别的．Ｃ语言中的指针里面存储的是变量的内容在内存中存放的地址变量的引用 PHP 的引用允许你用两个变量来指向同一个内容复制代码代码如下: <? $a="ABC"; $b =&$a; echo
SVN中trunk,branches,tags用法详解 dcj3sjt126com SVN
Subversion有一个很标准的目录结构，是这样的。比如项目是proj，svn地址为svn://proj/，那么标准的svn布局是svn://proj/|+-trunk+-branches+-tags这是一个标准的布局，trunk为主开发目录，branches为分支开发目录，tags为tag存档目录（不允许修改）。但是具体这几个目录应该如何使用，svn并没有明确的规范，更多的还是用户自己的习惯。
对软件设计的思考 e200702084 设计模式数据结构算法 ssh 活动
软件设计的宏观与微观软件开发是一种高智商的开发活动。一个优秀的软件设计人员不仅要从宏观上把握软件之间的开发，也要从微观上把握软件之间的开发。宏观上，可以应用面向对象设计，采用流行的SSH架构，采用web层，业务逻辑层，持久层分层架构。采用设计模式提供系统的健壮性和可维护性。微观上，对于一个类，甚至方法的调用，从计算机的角度模拟程序的运行情况。了解内存分配，参数传
同步、异步、阻塞、非阻塞 geeksun 非阻塞
同步、异步、阻塞、非阻塞这几个概念有时有点混淆，在此文试图解释一下。同步：发出方法调用后，当没有返回结果，当前线程会一直在等待（阻塞）状态。场景：打电话，营业厅窗口办业务、B/S架构的http请求-响应模式。异步：方法调用后不立即返回结果，调用结果通过状态、通知或回调通知方法调用者或接收者。异步方法调用后，当前线程不会阻塞，会继续执行其他任务。实现：
Reverse SSH Tunnel 反向打洞實錄 hongtoushizi ssh
實際的操作步驟： # 首先，在客戶那理的機器下指令連回我們自己的 Server，並設定自己 Server 上的 12345 port 會對應到幾器上的 SSH port ssh -NfR 12345:localhost:22 [email protected] # 然後在 myhost 的機器上連自己的 12345 port，就可以連回在客戶那的機器 ssh localhost -p 1
Hibernate中的缓存 Josh_Persistence 一级缓存 Hiberante缓存查询缓存二级缓存
Hibernate中的缓存一、Hiberante中常见的三大缓存：一级缓存，二级缓存和查询缓存。 Hibernate中提供了两级Cache，第一级别的缓存是Session级别的缓存，它是属于事务范围的缓存。这一级别的缓存是由hibernate管理的，一般情况下无需进行干预；第二级别的缓存是SessionFactory级别的缓存，它是属于进程范围或群集范围的缓存。这一级别的缓存
对象关系行为模式之延迟加载 home198979 PHP 架构延迟加载
形象化设计模式实战 HELLO!架构一、概念 Lazy Load：一个对象，它虽然不包含所需要的所有数据，但是知道怎么获取这些数据。延迟加载貌似很简单，就是在数据需要时再从数据库获取，减少数据库的消耗。但这其中还是有不少技巧的。二、实现延迟加载实现Lazy Load主要有四种方法：延迟初始化、虚
xml 验证 pengfeicao521 xml xml解析
有些字符，xml不能识别，用jdom或者dom4j解析的时候就报错 public static void testPattern() { // 含有非法字符的串 String str = "Jamey친Ñ&#1282
div设置半透明效果 spjich css 半透明
为div设置如下样式： div{filter:alpha(Opacity=80);-moz-opacity:0.5;opacity: 0.5;} 说明： 1、filter：对win IE设置半透明滤镜效果，filter:alpha(Opacity=80)代表该对象80%半透明，火狐浏览器不认2、-moz-opaci
你真的了解单例模式么？ w574240966 java 单例设计模式 jvm
单例模式，很多初学者认为单例模式很简单，并且认为自己已经掌握了这种设计模式。但事实上，你真的了解单例模式了么。一，单例模式的5中写法。（回字的四种写法，哈哈。） 1，懒汉式（1）线程不安全的懒汉式 public cla

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他