花梦飞

VAE/GAN学习笔记:Autoencoding beyond pixels using a learned similarity metric

paper：VAE/GAN

0、摘要

我们提供了一个自动编码器，它利用学习的表示来更好地度量数据空间地相似性。通过将变分自编码器与生成对抗网络相结合，我们可以利用GAN鉴别器中的学习特征表示作为VAE重建目标的基础。因此，我们将元素方面的错误替换为特征方面的错误，以便更好地捕获数据分布，同时提供对例如翻译的不变性对。我们将我们的方法应用到人脸图像上，并证明它在视觉逼真度方面比VAEs表现得更好。此外，我们还证明了该方法学习了一种嵌入方法，可以使用简单的算法提高高级抽象的视觉特征（例如戴眼镜）

1、介绍

深层架构允许广泛的区分模型扩展到大的和不同的数据集。然而，生成模型仍然存在图像和声音等复杂数据分布的问题。在这项工作中，我们展示了目前使用的相似度度量对学习好的生成模型设置了一个障碍，并且我们可以通过使用学习的相似度度量来改进生成模型。

学习变分自动编码器（VAE）模型时，相似度度量的选择是核心，通过重构误差目标提供训练信号的主要部分。

对于这个任务，元素级的度量，如平方误差是默认值。元素度量是简单的，但不太适合图像数据，因为他妈不模拟人类视觉感知的属性。一个小的图像翻译可能会导致一个大的像素错误，而一个几乎不会注意到变化。因为，我们主张使用更高层次和足够不变的图像表示来测量图像的相似性。我们希望为任务学习一个函数，而不是手工设计一个合适的方法来解决元素度量的问题。问题是如何学习这种相似性度量？我们发现，通过联合训练VAE和生成对抗网络（GAN），我们可以使用GAN鉴别器来测量样本相似性。我们通过将VAE和GAN结合实现这一点，如图所示，我们将VAE解码器和GAN生成器合并为一个。让它们共享参数并联合训练它们。对于VAE训练目标，我们将典型的元素重构度量替换为鉴别器中表示的特征度量。

1.1 贡献

·我们将VAEs和GANs合并为一个无监督生成模型，同时学习编码、生成和比较数据集样本。

·我们证明，接受过学习相似度度量训练的生成模型比接受过元素误差模拟训练的模型产生更好的图像样本。

·我们证明了无监督训练可以产生更具有解纠缠因子的潜在图像表示法。这一点在一个用视觉属性向量标记的人脸图像数据集中的实验中得到了证明，在学习的潜空间中应用简单的算法可以生成反映这些属性变化的图像。

2、自动编码和学习相似性

在本节中，我们将介绍VAEs和GANs的背景知识。然后，我们介绍了两种方法的结合方法，我们称之为VAE-GAN。正如我们将要描述的，我们所提出的混合模型是作为一种改进VAE的方法而被激发的，因此它依赖于一个更有意义的，更有特征的度量来度量训练期间的重构质量。

2.1 变分自编码器

VAE由两个网络组成，分别将数据样本x编码为潜在表示z，并将潜在表示解码回数据空间：

VAE通过对潜在分布p(z)施加一个先验来规范编码器。通过z~N(0,1)选择。VAE损失是减去预期的log似然函数（重构误差）和先验的正则化项的总和。

其中DKL 是KL散度。

2.2 生成对抗网络

GAN由两个网络：生成器Gen（z）由空间数据潜变量z映射，而判别器网络分配概率y=Dis(x)∈[0,1],x是实际的训练样本。GAN的目标是找到一个二进制分类器，它给出了真是数据和生成数据之间最好的区别，并同时鼓励Gen以符合真实的数据分布。因此，我们的目标是最大/最小交叉熵：

2.3 使用VAE/GAN重构元素误差

GAN的一个吸引人的特性是它的鉴别器网络必须隐式地学习丰富的图像相似度度量，以便区分它们与“生成图像”。因此我们建议利用这一观测结果，将鉴别器所获得的图像的性质转化为VAE的一种更抽象的重构误差。最终的结构是将GAN作为高质量生成模型的有点与VAE作为数据编码器生成到潜在空间z的方法相结合。

具体地说，由于元素的重构误差不适用于图像和其他具有不变性的信号，我们建议将VAE重构（预期的log似然）从等式3中替换为GAN鉴别器中表示的重构误差。为此，让Dis(x)表示鉴别器第l层的隐藏表示。

我们用三重准则训练组合模型：

值得注意的是，我们优化了VAE利用LGAN ，这个我们认为除了重构误差之外的一种样式误差，使用Gatys等人的术语可以将其解释为内容误差。此外，由于Dec和Gen从z映射到x，我们两者之间共享参数（换句话说，我们在等式5中使用Dec而不是Gen）。

在实践中，我们在开发和训练这个模型的细节中观察到了魔鬼。因此，我们在这一节中提供了一些实际的考虑事项。关于训练过程的概述，请参见图2和算法1.

图2，训练过程中流经VAE/GAN模型。灰色线表示训练目标中的术语。

将误差信号限制在相关网络上。利用等式8中的损失函数，我们同时训练VAE和GAN。这是可能的，因为我们不利用合并后的损失更新所有网络参数。特别是，Dis不应该试图最小化，因为这会使鉴别器崩溃为0,。我们也通过不将错误信号从LGAN 回传给Enc观察到更好的结果。

带权重的VAE和GAN。作为误差信号，我们使用一个参数γ作为判别器重构能力和欺骗能力的折中。这也可以解释为加权样式和内容。而不是对整个模型应用γ，只有当我们更新Dec的权重时：

基于p(z)和p(z|x)的采样。我们在GAN目标中使用p(z|x)（即编码器）的样本时，观察到更好的效果：

注意，潜在空间Lprior 的正则化应该使来自p(z)或p(z|x)的样本集类似。然而，对于任何给定的例子x，负样本Dec(Enc(x))比Dec(x)更可能与x相似。当根据LGAN 进行更新时，我们怀疑拥有更相似的正样本和负样本会产生更有用的学习信号。

3、相关工作

元素距离度量对于像图像这样的复杂数据分布来说是出了名的不足。在计算机视觉社区中，预处理图像是一个改进某些扰动鲁棒性的普遍解决方案。预处理的例子是对比度标准化，处理梯度图像或直方图中收集的像素统计信息。我们将这些操作视为度量工程的一种形式，以解释简单的元素距离度量的缺点。Wang（2009）对这一主题进行了更详细的讨论。

神经网络以Siamese体系结构的形式应用于度量学习。对于相似的样本。所学习的距离度量是最小的，对于不同的样本，所学习的距离度量是最大的。但是，由于Siamese网络是在受监督的环境下训练的，所以我们不能讲它们直接应用到我们的问题上。

在过去的一年里，已经有人提出了一些改进生成模型元素距离的尝试。Ridgeway（2015）将结构相似性指数作为灰度图像的自动编码器（AE）重构度量。Yan（2015）让VAE输出两个额外的图像来更明确地学习形状和边缘结构。Masimov（2015）在他们的生成模型中加入了基于gan-base的锐化步骤。Mathieu（2015）用GAN和基于图像梯度的相似性度量来补充平方误差测量，以提高视频预测的图像清晰度。虽然所有这些扩展都生成明显更清晰的图像，但与深度学习方法相比，它们在捕获高级结构方面没有相同的潜力。

与AEs直接模拟数据集样本和潜在表示的关系相比，GANs学会了间接的生成样本。通过优化GAN生成器根据GAN判别器生成模拟数据集的样本，通过构造避免元素间的相似性度量。这可能解释了它们制作高质量图像的能力，Denton（2015）就证明了这一点。

最近，具有向上采样的卷积网络已经显示从潜在的表示中生成图像的有用性。这引起了人们对学习图像嵌入的兴趣，在这种情况下，语义关系可以通过简单的算术来表达—类似于Mikolov等人在word2vec模型中令人惊讶的结果。首先，Dosovitskiy等人利用监督训练来训练复杂的网络，以生成椅子的高级信息。之后，kulkarni等已经演示了带有解离特征表示的编码解码器架构，但是他们的训练方案依赖于有监督的信息。Radford在训练后检查GAN的潜在空间，找到与眼镜和微笑对应的方向。然而，由于它们依赖于纯GANs，它们无法对图像进行编码，这使得探索潜在空间变得很困难。

我们关于学习相似度的概念部分都是受到Gatys等人的审计艺术风格网络的启发，该网络展示了深层卷积特征的代表性力量。他们通过优化图像来获得令人印象深刻的结果，使其具有与主题图像相似的特征，并与训练前的卷积网络中的样式图像具有相似的特征的相关性。在我们的VAE-GAN模型中，可以将LllikeDisl 视为内容，将LGAN 视为样式。不过，我们的样式项不是从特征相关性计算出来的，而是试图骗过GAN鉴别器的错误信号。

4、实验

由于现在的评估方法对较大的自然图像存在问题，因此评估生成模型的质量具有挑战性。在这项工作中，我们使用64×64大小的图像，并着重与更定性的评估，因为传统的log似然度量不能捕获视觉逼真度。实际上，我们已经尝试在VAE/GAN模型训练后丢弃GAN鉴别器，并使用剩余的VAE计算一个机遇像素的log似然。结果远比普通的VAE模型（在CIFAR-10数据集上）要好。

在本节中，我们将研究不同生成模型的性能。

基于元素的高斯观察模型的普通VAE。
学习距离的VAE。我们首先训练一个GAN，并使用鉴别器网络作为学习的相似度度量。我们选择一个单层l，根据Disl 测量相似度。选择l，以便在卷积编码器中对每个因子2进行3次下采样后进行比较。
VAE/GAN组合模型。该模型类似于VAEDisl ，但我们也优化了Dec关于LGAN 。
GAN。这种模式最近被证明能够生存高质量的图像。

所有的模型分别为Enc、Dec和Dis共享相同的结构。在我们所有的实验中，我们使用卷积结构和逆向卷积。在Dec，通过改变卷积方向，使之产生向上的采样，从而实现了步2到高阶的分数阶化卷积，我们的模型使用RMSProp进行训练，学习速率为0.0003，批处理大小为64,。在表1中，我们列出了网络结构。我们在线可用的实现参考网址：

https://github.com/andersbll/autoencoding_beyond_pixels。

4.1 CelebA人脸图片

我们将我们的方法应用于CelebA数据中的人脸图像。这个数据集包含202599张图片注释与40个二进制属性，如眼镜、刘海、苍白的皮肤等等。我们的规律和作物64×64像素的图像和只使用无监督的图像（而不是属性）训练。

经过训练，我们从p(z)中抽取样本，通过Dec生成新的图像，如图3所示。普通的VAE可以把脸的前部画得很明显，但是离开中心的图像会变得模糊。这是因为数据集使用前额标志物对人脸进行对齐。当我们离对齐的部分太远时，由于不能假定像素对应，识别模型就会崩溃。VAEDisl 甚至在中心外也能生成更清晰的图像，因为重构误差超过了像素。然而，我们看到了严重的噪音—我们认为这些噪音是由严厉的降级计划造成的，相比之下，VAE/GAN和pure GAN的图像更清晰，更自然的纹理和面部部分。

图3：来自不同生成模型的样本

图4：从不同的自动编码器重建

另外，我们让VAEs重构从一个单独的测试集中获取的图像。由于GAN模型缺乏编码器网络，所以用GAN模型重构是不可能的。结果如图4所示，我们的结论与我们从随机样本进行的观察相似。注意，VAEDisl 在一些重构中产生了噪声蓝色模式。我们怀疑基于gan-based的相似性度量在某些情况下会崩溃到0（例如我们服务的模式），这鼓励Dec生成这样的模型。

4.1.1 视觉属性向量

在尝试学习如何用简单的算术表达语义概念的嵌入的启发下，我们检查了训练有素的VAE/GAN模型的潜在空间。这个想法是为了在与图像空间中的特定视觉特征相对应的潜在空间寻找方向。

我们使用数据集的二进制属性来提取视觉属性向量。对于所有的图像，我们使用编码器来计算潜在向量表示，对于每个属性，我们计算具有属性的图像的均值向量和没有属性的图像的均值向量。然后计算视觉属性向量作为两个均值向量的差值。这是一种非常简单的方法，用于计算视觉属性向量，这些向量与高度相关的视觉属性（如浓妆和涂口红）存在问题。在图5中，我们将不同的视觉属性加入到潜在的表现形式中，展示了人脸图像以及重构。虽然不完美，但我们可以清楚地看到属性向量捕捉到了眼镜、刘海等语义概念。例如当把刘海添加到脸部时，头发的颜色和发质都与原脸相匹配。我们还发现，作为一个男人与胡子高度相关，这是数据集中的属性相关性造成的。

图5：使用VAE/GAN模型重构数据集样本，将视觉属性向量添加到它们的潜在表示中。

4.2 属性相似，标记人脸属性

受到Yan等人（2015）的属性相似实验的启发，我们寻求对生成的图像进行更定量的评价。这个想法是为了学习一个基于面部特征的面部图像的生成模型。在测试时，我们通过从选择的属性配置中检索人脸图像，并让一个单独训练的退化网络从生成的图像中预测属性。一个好的生产模型应该能够产生被回归模型正确识别的视觉属性。为了模仿原始实验，我们在野生（wild LEW）图像中使用标记的面孔和属性。我们根据Zhu的地标来排列人脸图像。此外，我们作物和调整64×64像素的图像和增加数据集与常见的操作。同样，我们要了解更多的细节，请参阅我们的online实现。

我们构造条件VAE、GAN和VAE/GAN模型，通过将属性向量连接到Enc、DEC和DIS中的输入的向量表示。对于Enc和Dis，属性向量连接到顶层完全连接层的输入。我们的回归网络几乎与Enc具有相同的体系结构。我们使用LEW训练集进行训练，在测试期间，我们对通过回归网络传播的测试集属性和样本面进行条件。图6显示了对来自测试集的属性向量进行条件作用生成的人脸。我们在表2中报告回归函数性能数。与普通的VAE模型相比，VAE/GAN模型在视觉上产生的属性明显更好，从而导致较小的识别错误。GAN网络的性能非常差，我们怀疑这是由于训练过程中的不稳定性（GAN模型由于极小极大目标函数而很难可靠地训练）。请注意，我们的结果与Yan等人（2015）的结果没有直接可比性，因为我们无法获得他们的预处理方案和回归模型。

图6：生成基于LFW属性的样本在相应的图像旁边列出。

表2：属性相似度分数。将余弦相似度作为测试集中每个属性向量的10个样本中最好的一个，在测试集中计算均值平方误差，统计量超过25次。

4.3 对监督任务进行无监督的预训练

为了完整起见，我们报告说，我们已经尝试在一个半监督的设置中对VAE/GAN进行评估，该设置由无监督的预训练完成，然后使用少量的标记示例进行优化。不幸的是，我们未能取得与最先进的技术相竞争的结果。我们推测，对于VAE/GAN模型来说，内部类的变化可能太高了，无法学习不同对象类的良好概括。

5、讨论

在文献中，对元素距离度量的问题是众所周知的，并且许多尝试都是在超越像素的情况下进行的—通常使用手工工程的方法。本着深度学习的精神，我们认为相似度度量是一个可以被一个可捕获与数据分布相关的高级结构的学习模型所取代的组件。在这项工作中，我们的主要贡献是一个学习和应用这种距离测量的无监督方案。通过学习距离测量，我们可以训练图像编码器网络生成前所未有的视觉逼真度的图像，如我们的实验所示。此外，我们还证明了我们的网络能够解开输入数据分布变化的因素，并在潜在空间的高级表示中发现视觉属性。原则上，这让我们可以使用一组大的未标记图像进行训练，并使用一组小的标记图像来发现隐藏空间中的特征。

我们认为我们的方法是VAE框架的扩展。但是，我们生成的图像的高质量是由于Dec同时作为VAE解码器和GAN生成器进行训练。这使得我们的方法更像是VAE和GAN之间的混合，或者，我们可以将我们的方法看作GAN的扩展，其中p(z)受到额外网络的约束。

GAN的鉴别器网络为不同的任务提供了有用的相似度度量，即能够从真实的样本中识别生成的样本。然而，卷积特征通常对传输学习非常有用，正如我们所展示的，在我们的例子中，卷积特性对图像的元素距离有足够的改善。如果在距离测量中有更好的功能可以改进模型，那将是很有趣的，例如，通过使用Siamese网络提供的相似度测量方法，因为他们需要标记数据。或者可以研究使用预先训练的前馈网络的效果相似度度量。

综上所述，我们演示了在无监督学习编码器模型已经相似度度量方面的首次尝试。我们的结果表明，我们的方法的视觉逼真度与GAN是竞争的，在这方面被认为是最先进的。因此，我们认为学习到的相似性度量是将生成模型扩展到更复杂的数据分布的一个有希望的步骤。

6 自己的一些思考

本文着重提出来的问题是关于VAE中真实数据和解码生成数据的相关性（距离）度量问题。之前采用的element-wise distance Metrics，这种metrics其实对于很多hidden feature/space 的学习并不好。

本文针对上述问题，提出的解决方案是：结合GAN网络的优势，将这种度量相似性的任务交给判别器去learn去就行。

2024年11月架构设计师论文真题回顾，附参考解答、解析及所涉知识点（一）一几文架构系统架构系统架构设计师软考高级 IT考证
软考高级系统架构设计师考试包含三个科目：信息系统综合知识、案例分析和系统架构设计论文。考试形式为机考。本文主要回顾2024年下半年(2024-11-10)系统架构设计师考试下午论文的题目，同时附带参考解答、解析和所涉知识点。综合知识2024年11月架构设计师综合知识真题回顾，附参考答案、解析及所涉知识点（一）2024年11月架构设计师综合知识真题回顾，附参考答案、解析及所涉知识点（二）2024年1
202505架构师论文《论静态负载均衡策略设计和应用》文琪小站系统架构师软考论文负载均衡运维软考论文
软件架构师论文范文系列摘要在当今高度依赖信息技术的时代，构建高性能、高可用的分布式系统已成为必然趋势。负载均衡作为分布式系统中的关键技术，旨在将请求或数据有效地分发到多个处理单元，以优化资源利用率、提升系统吞吐量并确保服务的稳定运行。本文深入探讨了静态负载均衡策略的设计原理、技术特点及其在实际项目中的应用。首先，概述了负载均衡的整体概念及静态策略的分类，重点介绍了基于哈希、轮询和权重等静态算法的实
【论文笔记】RAGLAB: A Modular and Research-Oriented Unified Framework for Retrieval-Augmented Generation AustinCyy 论文笔记论文阅读
论文信息论文标题：RAGLAB:AModularandResearch-OrientedUnifiedFrameworkforRetrieval-AugmentedGeneration-EMNLP24论文作者：XuanwangZhang-NanjingUniversity论文链接：https://arxiv.org/abs/2408.11381代码链接：https://github.com/fat
【超分辨率（Super-Resolution）】关于【超分辨率重建】专栏的相关说明，包含专栏简介、专栏亮点、适配人群、相关说明、阅读顺序、超分理解、实现流程、研究方向、论文代码数据集汇总等十小大超分辨率重建（理论+实战科研+应用）超分辨率重建人工智能图像处理深度学习计算机视觉图像超分 pytorch
文章目录专栏简介专栏亮点适配人群相关说明关于答疑环境配置超分理解实现流程文章目录基础知识三个常用的SR框架数据集相关可解释性（论文中的可视化说明）图像超分（ImageSuper-Resolution）经典超分（ClassicalSR）任意尺度超分（Arbitrary-ScaleSR）高效/轻量化超分（Efficient/LightweightSR，ESR）盲超分/真实世界图像超分辨率（Blind/
【图像超分】论文复现：密集残差链接Transformer！DRCT的Pytorch源码复现，跑通超分源码，获得指标、模型复杂度、结果可视化，核心模块拆解与源码对应，注释详细！十小大超分辨率重建（理论+实战科研+应用）pytorch 深度学习超分辨率重建图像处理计算机视觉 python transformer
请先看【专栏介绍文章】：【超分辨率（Super-Resolution）】关于【超分辨率重建】专栏的相关说明，包含专栏简介、专栏亮点、适配人群、相关说明、阅读顺序、超分理解、实现流程、研究方向、论文代码数据集汇总等）完整代码和训练好的模型权重文件下载链接见本文底部，订阅专栏免费获取！本文亮点：跑通DRCT源码，获得与论文一致的PSNR/SSIM、Params、超分可视化结果，修正论文中FLOPs的计
系统架构设计师论文分享-论软件架构复用
我的软考历程摘要2023年2月，我所在的公司通过了研发纱线MES系统的立项，该项目为国内纱线工厂提供SAAS服务，旨在提升纱线工厂的数字化和智能化水平。我在该项目中担任架构设计师，负责该项目的架构设计工作。本文结合我在该项目中的实践，详细论述了软件架构复用的实现过程。软件架构复用可以有效降低成本，提高开发速度和质量属性，架构复用方法的步骤分为三个过程：可复用资产的获取、架构复用的管理、架构复用的使
系统架构设计师论文分享-论软件体系结构的演化
我的软考历程摘要2023年2月，我所在的公司通过了研发纱线MES系统的立项，该系统为国内纱线工厂提供SAAS服务，旨在提高纱线工厂的数字化和智能化水平，我在该项目中担任架构设计师，负责该项目的架构设计工作。本文结合我在该项目中的实践，详细论述了软件体系结构的演化。系统上线后，为了满足新需求和适应新场景，就必须修改原有软件架构。在软件架构演化过程中遵循以下原则：演化适应新技术、有利于重构和重用、影响
系统架构设计师论文分享-论单元测试方法及其应用码农卿哥系统架构设计师系统架构单元测试
我的软考历程摘要2023年2月，我所在的公司做了开发纱线MES系统的决定，该系统为国内纱线工厂提供SAAS服务，旨在提高纱线工厂的智能化和数字化水平。我在该项目中被任命为系统架构设计师，全面掌管该项目的架构设计工作。本文将结合我在该项目中的架构设计工作经验，详细介绍如何把单元测试方法应用在项目中。在该项目中，我们采用了多种单元测试方法，包括静态测试和动态测试。静态测试在不运行程序的情况下，通过代码
271万+学术论文数据集 (2007-2025.4) .Android安卓科研室. 数据引用数据分析
文章目录数据下载地址数据指标说明一、数据介绍二、数据指标三、数据概览项目备注数据下载地址数据下载地址点击这里下载数据数据指标说明arXiv是一个向所有人开放的学术资源共享平台，创立于1991年，是开放获取运动的先驱。该平台由全球志愿者团队维护，目前已收录超过200万篇学术论文，涵盖物理学、计算机科学、数学等八大核心学科领域。通过近30年的发展，arXiv不仅为科研人员提供了免费的知识共享渠道，也成
YOLO融合synergisticNet中的模块今天炼丹了吗 YOLOv11与自研模型专栏 YOLO
YOLOv11v10v8使用教程：YOLOv11入门到入土使用教程YOLOv11改进汇总贴：YOLOv11及自研模型更新汇总《HyperSINet:ASynergeticInteractionNetworkCombinedWithConvolutionandTransformerforHyperspectralImageClassification》一、模块介绍论文链接：https://ieeex
计算机专业毕业答辩注意事项李子圆圆计算机网络 java 计算机人工智能
毕业答辩是计算机专业学习过程中的重要环节，它不仅是对学生多年学习成果的综合检验，也是展示个人专业能力和学术素养的重要机会。为了帮助同学们在答辩中取得优异成绩，顺利迈出校园，走向职场或更高的学术殿堂，以下为大家详细介绍计算机专业毕业答辩的注意事项。一、前期准备（一）论文内容把控熟悉论文细节：对自己撰写的毕业论文要了如指掌，从研究背景、目的、意义，到具体的研究方法、技术实现细节、实验过程及结果分析，每
【科研写作自动化工具】如何用AI技术组合（大模型+多Agent+自动化）打造一个“智能论文生产线”，把枯燥的写作流程变成自动化
n8n是一款开源的工作流自动化工具，类似于Zapier或Make（原Integromat），但更注重灵活性和开发者友好性。在课程文件中提到的n8n自动化流水线主要用于科研写作的自动化流程集成，以下是详细解释：n8n的核心功能可视化工作流设计：通过拖拽节点（Nodes）连接不同工具和服务，无需编写复杂代码即可搭建自动化流程。多平台集成：支持连接文献数据库（如PubMed、arXiv）、AI模型（如O
结合创新idea：机器学习+运筹优化=CCF高端局 Ai多利机器学习人工智能
2024深度学习发论文&模型涨点之——机器学习+运筹优化机器学习是人工智能的一个分支，它使计算机系统能够从数据中学习并改进其性能，而无需进行明确的编程。运筹优化，也称为运筹学或运营管理，是应用数学的一个分支，它使用数学模型和算法来支持复杂决策过程的制定。机器学习与运筹优化的结合是一个前沿且活跃的研究领域，它们相互补充，为解决复杂问题提供了新的思路和方法。小编整理了一些机器学习+运筹优化【论文+代码
Latex beamer 常用操作记录
最近组会要讲论文，试着用latex做下slide，感觉效果不错。在此，记录一些可能会比较常用的一些操作。以后学到了新的操作，再继续更新。用的是这个主题，感觉比较简洁：https://www.overleaf.com/latex/templates/artrabeamer/cvtmgdbwvdmr放置图片图片感觉有好多参数，因为这次汇报比较水，所以只用了scale这个缩放参数凑合，以后再补上一些常用
JSP汽车网站yzp17--（程序+源码+数据库+调试部署+开发环境） CK3042 java 汽车开发语言 oracle 数据库服务器大数据
本系统（程序+源码+数据库+调试部署+开发环境）带论文文档1万字以上，文末可获取，系统界面在最后面。系统程序文件列表开题报告内容一、项目背景随着互联网的飞速发展和人民生活水平的日益提高，汽车已成为许多家庭的重要交通工具。为了更好地满足消费者对汽车信息的需求，提升购车体验，我们计划开发一个功能全面、信息丰富的汽车网站。该项目旨在为用户提供便捷的汽车资讯查询、车型对比、购车指南以及售后服务等功能，打造
SurveyForge：AI自动撰写综述论文的革命性工具，助力科研效率跃升花生糖@ AIGC学习资料库人工智能 AI论文 AI助手
在学术研究领域，综述论文（SurveyPaper）的撰写是一项耗时且复杂的任务，通常需要数周甚至数月的文献调研与内容整合。如今，上海人工智能实验室、复旦大学与上海交通大学联合开源的SurveyForge，通过创新的AI技术，将这一过程压缩至10分钟内，且生成质量接近人工水平，成为科研人员的得力助手。项目简介SurveyForge是一款基于大语言模型（LLM）的自动综述论文生成工具，专为计算机科学领
纹理贴图算法研究论文综述点云SLAM 算法图形图像处理算法纹理贴图计算机图形学计算机视觉人工智能虚拟现实（VR）纹理贴图算法综述
纹理贴图（TextureMapping）是计算机图形学和计算机视觉中的核心技术，广泛应用于三维重建、游戏渲染、虚拟现实（VR）、增强现实（AR）等领域。对其算法的研究涵盖了纹理生成、映射、缝合、优化等多个方面。1.引言纹理贴图是指将二维图像纹理映射到三维几何表面上，以增强模型的视觉真实感。传统方法主要关注静态几何模型上的纹理生成与映射，而近年来，随着多视角图像重建、RGB-D扫描、神经渲染的发展，
计算机视觉中的Transformer：ViT模型详解与代码实现 AI大模型应用工坊计算机视觉 transformer 人工智能 ai
计算机视觉中的Transformer：ViT模型详解与代码实现关键词：计算机视觉、Transformer、ViT、自注意力机制、图像分块摘要：传统卷积神经网络（CNN）统治计算机视觉领域多年，但2020年一篇《AnImageisWorth16x16Words:TransformersforImageRecognitionatScale》的论文打破了这一格局——它将NLP领域的Transformer
《小学生作文辅导》期刊投稿邮箱
《小学生作文辅导》是国家新闻出版总署批准的正规教育类期刊，适用于全国各小学语文老师事业单位及个人，具有原创性的学术理论、工作实践、科研成果和科研课题及相关领域等人员评高级职称时的论文发表（单位有特殊要求除外）。栏目设置：写法导引、智慧阅读、课堂建设、课堂建设、教学透视、教育撷英等。刊名：小学生作文辅导级别：省级主管单位：吉林出版集团股份有限公司主办单位：北方妇女儿童出版社有限责任公司ISSN：16
结构学习的理论刘海东刘海东机器人人工智能
结构学习的理论作者：刘海东，中国广东技术师范大学摘要这是第一篇研究结构学习的理论的论文，第一个部分概括了结构学习的整体构想，第二部分提出了结构学习的环境逻辑宇宙，第三、第四、第五部分阐述了中央图处理器、软件图、图思维的理论，以中央图处理器为机器脑，以软件图为机器身体，以图思维为机器生命活动，第六部分说明了机器生命和结构学习的现有研究成果。全文的主旨是向人类社会推荐机器生命结构学习的思想。关键词：结
逻辑结构学派一（五个基础理论）刘海东刘海东人工智能
逻辑结构学派一（五个基础理论）作者：刘海东，中国广东技术师范大学摘要本篇论文通过《逻辑结构学派的宗旨》、《逻辑结构学》、《逻辑工程学》、《逻辑方程结构图理论》、《仿生逻辑理论》五个领域的研究提出《逻辑结构学派的宗旨》、《主观能动性结构》、《主观能动性结构工程》、《赋予生命的逻辑方程结构图》、《仿生逻辑》五个基础经典理论，让人工智能、机器人、智能社会三个主体的基础研究有了方向、方法和判断标准。关键词
【CVPR2024】计算机视觉|即插即用|DFAM:marine！不懂DFAM，别说你会做水下动物分割！
论文地址：http://arxiv.org/pdf/2404.04996v1代码地址：https://github.com/Drchip61/Dual_SAM关注UPCV缝合怪，分享最计算机视觉新即插即用模块，并提供配套的论文资料与代码。https://space.bilibili.com/473764881摘要本研究提出了一种新颖的特征学习框架，名为**Dual-SAM，用于高性能的海洋动物分割
RT‑DETR 系列发展时间顺序要努力啊啊啊计算机视觉深度学习计算机视觉目标检测人工智能
RT‑DETR系列发展时间顺序RT‑DETR系列是由百度提出的一系列基于Transformer的实时端到端目标检测器，以下列出了从提出到演化的主要milestone：时间线概览版本时间主要改进/特点DETR2020–05（论文）oai_citation:0‡labellerr.comoai_citation:1‡arxiv.orgTransformer架构首次用于端到端检测，无需NMSRT‑DET
蚁群算法佛渡红尘计算机应用与算法算法 c++数据结构
蚁群算法是一种用来寻找优化路径的概率型算法，由MarcoDorigo于1992年在他的博士论文中提出。这种算法模拟了蚂蚁觅食的原理，蚂蚁在觅食过程中能够在其经过的路径上留下一种称之为信息素的物质，并在觅食过程中能够感知这种物质的强度，从而指导自己的行动方向。它们总是朝着信息素强度高的方向移动，因此大量蚂蚁组成的集体觅食表现为一种对信息素的正反馈现象。某一条路径越短，路径上经过的蚂蚁越多，其信息素遗
【ICLR 2022】时序精选论文08｜Pyraformer: 基于金字塔注意力机制与多尺度辨识卷积的时间序列预测模型（代码解读附源码） OverOnEarth 时间序列预测项目实战人工智能机器学习深度学习 python 算法
ICLR2022PYRAFORMER:LOW-COMPLEXITYPYRAMIDALAT-TENTIONFORLONG-RANGETIMESERIESMODELINGANDFORECASTINGPyraformer要解决的问题基于时间序列数据面临的挑战：建立一个灵活但简约的模型，能够捕获不同范围的时间依赖性。时间序列通常表现为短期和长期的重复模式，将他们考虑在内是准确预测的关键。即能够获得一个同时
【LLM论文阅读】一只齐刘海的猫论文阅读
LLM论文阅读论文重点论文链接RopeRoFormer:EnhancedTransformerwithRotaryPositionEmbeddingRoPE论文阅读YarnUnderstandingYaRN:ExtendingContextWindowofLLMs论文YaRN笔记T5ExploringtheLimitsofTransferLearningwithaUnifiedText-to-Te
SmartPDF：轻松应对 PDF 文件难题 KJ-拾荒者 pdf 经验分享职场和发展软件推荐性能优化电脑
在日常工作与学习中，处理PDF文件时，我们常常碰到让人头疼的状况。像是面对几十页甚至上百页的合同、报告，想要快速找到关键条款或特定数据，手动翻阅耗时又费力；撰写论文参考多篇PDF文献，想整合有用内容，却因复制粘贴格式错乱而焦头烂额；还有想把PDF里的部分页面单独保存，或是将其转换成其他格式进一步编辑，常规方法却难以实现。别担心，SmartPDF软件可以为你排忧解难。SmartPDF功能丰富且实用。
[读论文] Towards Machine Learning for Placement and Routing in Chip Design: a Methodological Overview SP FA #EDA+AI 机器学习人工智能
Abstract在现代芯片设计流程中，放置和布线是两个不可或缺且具有挑战性的NP-hard问题。与使用启发式算法或专家精心设计的算法的传统求解器相比，机器学习凭借其数据驱动的性质显示出了广阔的前景，它可以减少对知识和先验的依赖，并且通过其先进的计算范式具有更大的可扩展性(例如GPU加速的深度网络)。本调查首先介绍了基本的布局（Placement）和布线（Routing），并简要介绍了经典的无学习解
计算机毕业设计Python知识图谱中华古诗词可视化古诗词情感分析古诗词智能问答系统 AI大模型自动写诗大数据毕业设计(源码+LW文档+PPT+讲解) B站计算机毕业设计大学大数据毕业设计人工智能课程设计知识图谱 python 大数据深度学习爬虫
温馨提示：文末有CSDN平台官方提供的学长联系方式的名片！温馨提示：文末有CSDN平台官方提供的学长联系方式的名片！温馨提示：文末有CSDN平台官方提供的学长联系方式的名片！信息安全/网络安全大模型、大数据、深度学习领域中科院硕士在读，所有源码均一手开发！感兴趣的可以先收藏起来，还有大家在毕设选题，项目以及论文编写等相关问题都可以给我留言咨询，希望帮助更多的人介绍资料《Python知识图谱中华古诗
计算机毕业设计Python知识图谱中华古诗词可视化古诗词情感分析古诗词智能问答系统 AI大模型自动写诗大数据毕业设计(源码+LW文档+PPT+讲解)
温馨提示：文末有CSDN平台官方提供的学长联系方式的名片！温馨提示：文末有CSDN平台官方提供的学长联系方式的名片！温馨提示：文末有CSDN平台官方提供的学长联系方式的名片！信息安全/网络安全大模型、大数据、深度学习领域中科院硕士在读，所有源码均一手开发！感兴趣的可以先收藏起来，还有大家在毕设选题，项目以及论文编写等相关问题都可以给我留言咨询，希望帮助更多的人介绍资料Python知识图谱中华古诗词
java解析APK 3213213333332132 java apk linux 解析APK
解析apk有两种方法 1、结合安卓提供apktool工具，用java执行cmd解析命令获取apk信息 2、利用相关jar包里的集成方法解析apk 这里只给出第二种方法，因为第一种方法在linux服务器下会出现不在控制范围之内的结果。 public class ApkUtil { /** * 日志对象 */ private static Logger
nginx自定义ip访问N种方法 ronin47 nginx 禁止ip访问
　　　因业务需要，禁止一部分内网访问接口，　由于前端架了F5，直接用deny或allow是不行的，这是因为直接获取的前端Ｆ５的地址。　　　所以开始思考有哪些主案可以实现这样的需求，目前可实施的是三种：　　　一：把ip段放在redis里，写一段lua 二：利用geo传递变量，写一段
mysql timestamp类型字段的CURRENT_TIMESTAMP与ON UPDATE CURRENT_TIMESTAMP属性 dcj3sjt126com mysql
timestamp有两个属性，分别是CURRENT_TIMESTAMP 和ON UPDATE CURRENT_TIMESTAMP两种，使用情况分别如下： 1. CURRENT_TIMESTAMP 当要向数据库执行insert操作时，如果有个timestamp字段属性设为 CURRENT_TIMESTAMP，则无论这
struts2+spring+hibernate分页显示 171815164 Hibernate
分页显示一直是web开发中一大烦琐的难题，传统的网页设计只在一个JSP或者ASP页面中书写所有关于数据库操作的代码，那样做分页可能简单一点，但当把网站分层开发后，分页就比较困难了，下面是我做Spring+Hibernate+Struts2项目时设计的分页代码，与大家分享交流。　　1、DAO层接口的设计，在MemberDao接口中定义了如下两个方法： public in
构建自己的Wrapper应用 g21121 rap
我们已经了解Wrapper的目录结构，下面可是正式利用Wrapper来包装我们自己的应用，这里假设Wrapper的安装目录为:/usr/local/wrapper。首先，创建项目应用 &nb
[简单]工作记录_多线程相关 53873039oycg 多线程
最近遇到多线程的问题,原来使用异步请求多个接口(n*3次请求) 方案一使用多线程一次返回数据,最开始是使用5个线程,一个线程顺序请求3个接口,超时终止返回缺点测试发现必须3个接
调试jdk中的源码，查看jdk局部变量程序员是怎么炼成的 jdk 源码
转自：http://www.douban.com/note/211369821/ 学习jdk源码时使用-- 学习java最好的办法就是看jdk源代码，面对浩瀚的jdk（光源码就有40M多，比一个大型网站的源码都多）从何入手呢，要是能单步调试跟进到jdk源码里并且能查看其中的局部变量最好了。可惜的是sun提供的jdk并不能查看运行中的局部变量
Oracle RAC Failover 详解 aijuans oracle
Oracle RAC 同时具备HA(High Availiablity) 和LB(LoadBalance). 而其高可用性的基础就是Failover(故障转移). 它指集群中任何一个节点的故障都不会影响用户的使用，连接到故障节点的用户会被自动转移到健康节点，从用户感受而言，是感觉不到这种切换。 Oracle 10g RAC 的Failover 可以分为3种： 1. Client-Si
form表单提交数据编码方式及tomcat的接受编码方式 antonyup_2006 JavaScript tomcat 浏览器互联网 servlet
原帖地址：http://www.iteye.com/topic/266705 form有2中方法把数据提交给服务器，get和post,分别说下吧。（一）get提交 1.首先说下客户端（浏览器）的form表单用get方法是如何将数据编码后提交给服务器端的吧。对于get方法来说，都是把数据串联在请求的url后面作为参数，如：http://localhost:
JS初学者必知的基础百合不是茶 js函数 js入门基础
JavaScript是网页的交互语言,实现网页的各种效果, JavaScript 是世界上最流行的脚本语言。 JavaScript 是属于 web 的语言，它适用于 PC、笔记本电脑、平板电脑和移动电话。 JavaScript 被设计为向 HTML 页面增加交互性。许多 HTML 开发者都不是程序员，但是 JavaScript 却拥有非常简单的语法。几乎每个人都有能力将小的
iBatis的分页分析与详解 bijian1013 java ibatis
分页是操作数据库型系统常遇到的问题。分页实现方法很多，但效率的差异就很大了。iBatis是通过什么方式来实现这个分页的了。查看它的实现部分，发现返回的PaginatedList实际上是个接口，实现这个接口的是PaginatedDataList类的对象，查看PaginatedDataList类发现，每次翻页的时候最
精通Oracle10编程SQL(15)使用对象类型 bijian1013 oracle 数据库 plsql
/* *使用对象类型 */ --建立和使用简单对象类型 --对象类型包括对象类型规范和对象类型体两部分。 --建立和使用不包含任何方法的对象类型 CREATE OR REPLACE TYPE person_typ1 as OBJECT( name varchar2(10),gender varchar2(4),birthdate date ); drop type p
【Linux命令二】文本处理命令awk bit1129 linux命令
awk是Linux用来进行文本处理的命令，在日常工作中，广泛应用于日志分析。awk是一门解释型编程语言，包含变量，数组，循环控制结构，条件控制结构等。它的语法采用类C语言的语法。 awk命令用来做什么？ 1.awk适用于具有一定结构的文本行，对其中的列进行提取信息 2.awk可以把当前正在处理的文本行提交给Linux的其它命令处理，然后把直接结构返回给awk 3.awk实际工
JAVA(ssh2框架)+Flex实现权限控制方案分析白糖_ java
目前项目使用的是Struts2+Hibernate+Spring的架构模式，目前已经有一套针对SSH2的权限系统，运行良好。但是项目有了新需求：在目前系统的基础上使用Flex逐步取代JSP，在取代JSP过程中可能存在Flex与JSP并存的情况，所以权限系统需要进行修改。【SSH2权限系统的实现机制】权限控制分为页面和后台两块：不同类型用户的帐号分配的访问权限是不同的，用户使
angular.forEach boyitech AngularJS AngularJS API angular.forEach
angular.forEach 描述: 循环对obj对象的每个元素调用iterator, obj对象可以是一个Object或一个Array. Iterator函数调用方法: iterator(value, key, obj), 其中obj是被迭代对象，key是obj的property key或者是数组的index，value就是相应的值啦. (此函数不能够迭代继承的属性.)
java-谷歌面试题-给定一个排序数组，如何构造一个二叉排序树 bylijinnan 二叉排序树
import java.util.LinkedList; public class CreateBSTfromSortedArray { /** * 题目:给定一个排序数组，如何构造一个二叉排序树 * 递归 */ public static void main(String[] args) { int[] data = { 1, 2, 3, 4,
action执行2次 Chen.H JavaScript jsp XHTML css Webwork
xwork 写道 <action name="userTypeAction" class="com.ekangcount.website.system.view.action.UserTypeAction"> <result name="ssss" type="dispatcher">
[时空与能量]逆转时空需要消耗大量能源 comsci 能源
无论如何,人类始终都想摆脱时间和空间的限制....但是受到质量与能量关系的限制,我们人类在目前和今后很长一段时间内,都无法获得大量廉价的能源来进行时空跨越..... 在进行时空穿梭的实验中,消耗超大规模的能源是必然
oracle的正则表达式(regular expression)详细介绍 daizj oracle 正则表达式
正则表达式是很多编程语言中都有的。可惜oracle8i、oracle9i中一直迟迟不肯加入，好在oracle10g中终于增加了期盼已久的正则表达式功能。你可以在oracle10g中使用正则表达式肆意地匹配你想匹配的任何字符串了。正则表达式中常用到的元数据(metacharacter)如下： ^ 匹配字符串的开头位置。 $ 匹配支付传的结尾位置。 *
报表工具与报表性能的关系 datamachine 报表工具 birt 报表性能润乾报表
在选择报表工具时，性能一直是用户关心的指标，但是，报表工具的性能和整个报表系统的性能有多大关系呢？要回答这个问题，首先要分析一下报表的处理过程包含哪些环节，哪些环节容易出现性能瓶颈，如何优化这些环节。一、报表处理的一般过程分析 1、用户选择报表输入参数后，报表引擎会根据报表模板和输入参数来解析报表，并将数据计算和读取请求以SQL的方式发送给数据库。 2、
初一上学期难记忆单词背诵第一课 dcj3sjt126com word english
what 什么 your 你 name 名字 my 我的 am 是 one 一 two 二 three 三 four 四 five 五 class 班级，课 six 六 seven 七 eight 八 nince 九 ten 十 zero 零 how 怎样 old 老的 eleven 十一 twelve 十二 thirteen
我学过和准备学的各种技术 dcj3sjt126com 技术
语言VB https://msdn.microsoft.com/zh-cn/library/2x7h1hfk.aspxJava http://docs.oracle.com/javase/8/C# https://msdn.microsoft.com/library/vstudioPHP http://php.net/manual/en/Html
struts2中token防止重复提交表单蕃薯耀重复提交表单 struts2中token
struts2中token防止重复提交表单 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年7月12日 11:52:32 星期日 ht
线性查找二维数组 hao3100590 二维数组
1.算法描述有序（行有序，列有序，且每行从左至右递增，列从上至下递增）二维数组查找，要求复杂度O(n) 2.使用到的相关知识：结构体定义和使用，二维数组传递（http://blog.csdn.net/yzhhmhm/article/details/2045816） 3.使用数组名传递这个的不便之处很明显，一旦确定就是不能设置列值 //使
spring security 3中推荐使用BCrypt算法加密密码 jackyrong Spring Security
spring security 3中推荐使用BCrypt算法加密密码了，以前使用的是md5， Md5PasswordEncoder 和 ShaPasswordEncoder，现在不推荐了，推荐用bcrpt Bcrpt中的salt可以是随机的，比如： int i = 0; while (i < 10) { String password = "1234
学习编程并不难,做到以下几点即可! lampcy java html 编程语言
不论你是想自己设计游戏，还是开发iPhone或安卓手机上的应用，还是仅仅为了娱乐，学习编程语言都是一条必经之路。编程语言种类繁多，用途各异，然而一旦掌握其中之一，其他的也就迎刃而解。作为初学者，你可能要先从Java或HTML开始学，一旦掌握了一门编程语言，你就发挥无穷的想象，开发各种神奇的软件啦。 1、确定目标学习编程语言既充满乐趣，又充满挑战。有些花费多年时间学习一门编程语言的大学生到
架构师之mysql----------------用group+inner join,left join ,right join 查重复数据（替代in) nannan408 right join
1.前言。如题。 2.代码 (1)单表查重复数据,根据a分组 SELECT m.a,m.b, INNER JOIN （select a,b,COUNT(*) AS rank FROM test.`A` A GROUP BY a HAVING rank>1 )k ON m.a=k.a （2）多表查询，使用改为le
jQuery选择器小结 VS 节点查找（附css的一些东西） Everyday都不同 jquery css name选择器追加元素查找节点
最近做前端页面，频繁用到一些jQuery的选择器，所以特意来总结一下：测试页面： <html> <head> <script src="jquery-1.7.2.min.js"></script> <script> /*$(function() { $(documen
关于EXT tntxia ext
ExtJS是一个很不错的Ajax框架，可以用来开发带有华丽外观的富客户端应用，使得我们的b/s应用更加具有活力及生命力。ExtJS是一个用 javascript编写，与后台技术无关的前端ajax框架。因此，可以把ExtJS用在.Net、Java、Php等各种开发语言开发的应用中。 ExtJs最开始基于YUI技术，由开发人员Jack
一个MIT计算机博士对数学的思考 xjnine Math
在过去的一年中，我一直在数学的海洋中游荡，research进展不多，对于数学世界的阅历算是有了一些长进。为什么要深入数学的世界？作为计算机的学生，我没有任何企图要成为一个数学家。我学习数学的目的，是要想爬上巨人的肩膀，希望站在更高的高度，能把我自己研究的东西看得更深广一些。说起来，我在刚来这个学校的时候，并没有预料到我将会有一个深入数学的旅程。我的导师最初希望我去做的题目，是对appe