我是喵喵酱

Cascade EF-GAN: Progressive Facial Expression Editing with Local Focuses 论文解读

题目：Cascade EF-GAN：局部聚焦渐进式面部表情编辑
时间：2020.3
作者：Rongliang Wu, Gongjie Zhang, Shijian Lu, and Tao Chen
CVPR 2020

Abstract

目前面部表情编辑存在的问题：生成性对抗网络（GAN）的最新进展表明，面部表情编辑有了显著的改进。然而，当前的方法仍然容易在表达密集型区域周围产生伪影和模糊，并且在处理大间隙表达转换（例如从愤怒到大笑的转换）时，经常引入不希望的重叠伪影。
本文提出的方案：
（1）为了解决这些局限性，我们提出了Cascade Expression Focal GAN（Cascade EF-GAN），这是一种新的网络，可以使用局部表情焦点进行渐进式面部表情编辑。局部聚焦的引入使Cascade EF-GAN能够更好地保留眼睛、鼻子和嘴巴周围与身份相关的特征和细节，这进一步有助于减少生成的面部图像中的伪影和模糊。
（2）此外，设计了一种创新的级联变换策略，将大型面部表情变换分解为级联中的多个小型表情变换，这有助于抑制重叠伪影，并在处理大间隙表情变换时产生更逼真的编辑效果。
（3）在两个公开的面部表情数据集上进行的大量实验表明，我们提出的级联EF-GAN在面部表情编辑方面取得了优异的性能。

1.Introduction

面部表情编辑发展现状：面部表情打开了一扇了解人们内部情绪的窗口，传达了微妙的意图，关于面部表情的自动识别有很多研究工作。在数字媒体的今天和时代，面部表情编辑即将给定面部图像的表情转换为目标表情，而不丢失身份属性，有可能应用于不同的领域，比如说摄影技术、电影产业、娱乐业等。它越来越受到学术界和工业界的关注。
现有的面部表情编辑方法存在的不足：受生成性对抗网络（GANs）最近的成功启发，报告的几项研究工作已经取得了非常令人印象深刻的面部表情编辑结果。另一方面，现有的方法仍然面临一些约束。首先，现有的方法往往会产生不连贯的伪影和/或模糊，尤其是在那些表情丰富的区域，如眼睛、鼻子和嘴巴周围。第二，当源面部表情与目标面部表情存在较大差距时，现有方法往往会产生重叠伪影，例如从愤怒到大笑的转换。
现有的面部表情编辑方法只将图像作为整体处理，没有特别关注与局部身份相关的特征（眼/鼻子/嘴巴）：面部表情编辑的任务需要维护个人身份。作为人类，识别面部图像的自然方法是特别注意眼睛、鼻子和嘴巴，这主要是因为这些区域包含丰富的身份相关信息。另一方面，几乎所有基于GAN的面部表情编辑方法都只是将输入的面部图像作为一个整体进行处理，而没有特别注意与局部身份相关的特征，这可能是大多数现有方法在眼睛、鼻子和嘴巴周围产生不连贯伪影和模糊的一个主要原因。
此外，据我们所知，所有现有的基于GANs的面部表情编辑方法都对目标表情执行一步转换。另一方面，由于网络容量的限制，在处理大间隙变换时，单步变换通常会产生重叠伪影（在面部表情变化较大的区域周围）。由于面部表情的变化本质上是连续的，如果网络将其分解为许多小的变换，那么大的间隙变换应该更好地完成。
在这篇论文中，我们提出了一种新的级联表达局部GAN（级联EF-GAN），用于局部聚焦的渐进式面部表情编辑。级联EF-GAN由级联中几个相同的EF-GAN模块组成，这些模块以渐进的方式执行面部表情编辑。具体而言，设计了一种创新的级联变换策略，将大型面部表情变换分解为多个小型面部表情变换，并循序渐进的执行面部表情变换。这种渐进式面部表情转换有助于抑制重叠伪影，并在处理大间隙面部表情转换时实现更健壮、更逼真的表情编辑。此外，每个EF-GAN模块都包含许多预定义的局部焦点，分别捕捉眼睛、鼻子和嘴巴周围与身份相关的特征。EF-GAN具有与身份相关的详细特征，能够生成具有更少伪影的连贯面部表情图像。我们提出的级联EF-GAN的结果如图1所示。
本文的贡献
（1）首先，我们确定了局部焦点在面部表情编辑中的重要性，并提出了一种新的EF-GAN，它可以捕获具有多个局部焦点的身份相关特征，并有效地减少编辑伪影和模糊。
（2）其次，我们提出了一个创新的渐进式面部表情编辑级联设计。级联设计在处理较大间隙的表情转化时，在抑制重叠伪影方面是稳健而有效的。（重叠伪影指的是原始表达式和目标表达式在输出中混合的伪影）。
（3）第三，大量实验表明，Cascade EF-GAN在定量和定性上都实现了出色的面部表情编辑。

2.Related Work

生成性对抗网络：生成性对抗网是一种强大的生成模型，可以同时训练生成器生成逼真的假图像，并训练鉴别器区分真假图像。一个活跃的研究主题是条件GANs，它包含条件信息去控制生成图像。此外，CycleGAN采用cycle-consistency（循环一致性）损失，并在保留关键属性的情况下实现图像到图像的转换。GANs在不同的计算机视觉任务中表现出了强大的能力，如自然图像合成、图像风格转换、超分辨率、图像修复、面部属性编辑、面部图像合成等，GAN生成的图像也被应用于不同的计算机视觉任务。我们的Cascade EF-GAN设计用于执行面部表情编辑，使用条件变量控制目标表情，并使用循环一致性以保留身份信息。
面部表情编辑：面部表情编辑很有挑战性，因为它需要对输入的面部图像进行高水平的理解，并事先了解人类表情。与只考虑特定面部区域外观修改的一般面部属性编辑相比，面部表情编辑是一项更具挑战性的任务，因为它通常涉及较大的几何变化，需要同时修改多个面部组件。近年来，随着GANs的流行，已经取得了非常令人印象深刻的进展。例如，G2-GAN和GCGAN采用面部地标作为几何先验，以控制生成的面部表情的强度，其中ground-truth图像对于提取几何信息至关重要。ExprGAN引入了一个表达式控制器来控制生成表情的强度，但它需要一个预训练的人脸识别器来保存身份信息。StarGAN可以使用单一模型跨域翻译图像，并通过最小化循环损失来保留身份特征，但它只能生成离散表达式。GANimation采用动作单元作为表情标签，可以在连续域中生成表情。它还包括注意机制来更好地保存身份信息。然而，它往往会产生伪影和模糊，无法很好地处理大间隙表情转换。
我们提出的级联EF-GAN方法没有像现有的基于GAN的方法那样在整个人脸图像上生成表情，而是将局部焦点放在眼睛、鼻子和嘴的区域上，有助于抑制伪影和清晰的保留细节。此外，级联策略以渐进的方式编辑表情，在处理非常不同的表情转换时能够有效地抑制重叠的伪影。

3.Proposed Methods

图2显示了我们提出的级联EF-GAN的总体框架。如图2所示，级联EF-GAN由级联中的多个EF-GAN组成，它们以渐进的方式执行表情编辑。每个EF-GAN共享相同的体系结构，其中包括一个表情转换器和一个细化器。具体来说，每个EF-GAN模块中都包含了几个预定义的局部焦点分支，以便更好地保存眼睛、鼻子和嘴巴周围与身份相关的特征和细节。更多细节将在接下来的小节中讨论。

3.1EF-GAN with Attention-Driven Local Focuses

EF-GAN中的生成模型由一个表情转换器和一个细化器组成，前者执行带有局部焦点的表情编辑，后者融合表情转换器的输出并细化最终编辑。
表情转换器。图2显示了我们的表情转换器的架构。我们的级联EF-GAN说明：工作流显示在左侧，每个EF-GAN的详细信息显示在放大区域。表情编辑分为3个步骤，由每个EF-GAN逐步处理。EF-GAN由一个表情转换器和一个细化器组成：前者生成整个人脸图像和三个局部人脸区域的初始编辑，后者融合初始编辑并细化，生成表情图像作为最终输出。
现有的方法的不足：现有的方法使用单个全局分支处理面部图像，虽然卷积核在所有空间位置共享，但每个面部区域都有不同的身份相关特征。因此，仅仅用一组卷积核将人脸图像作为一个整体进行处理，不足以捕获每个人脸区域周围与身份相关的细节。
我们的表情转换器的改进：包含三个额外的局部分支，分别对眼睛、鼻子和嘴巴周围的局部区域进行预定义聚焦。通过在全局和局部分支中处理面部图像来应对现有方法的不足，其中全局分支捕获全局面部结构，局部分支关注更详细的面部特征。
具体而言，表情转换器将面部图像和目标表情标签作为输入。与GANimation类似，我们采用了面部动作编码系统（FACS），该系统将表情编码为动作单元（AUs），可以使用开源OpenFace提取动作单元。我们采用连续的AUs强度作为AUs标签来监督编辑过程。给定源面部表情图像，通过裁剪相应的局部图像块，首先将局部焦点应用于眼睛、鼻子和嘴巴区域。OpenFace还获取了每个局部焦点的地标。然后，将全局人脸图像及其局部贴片反馈给相应的表情转换器的分支，用于表情编辑。注意：所有分支共享相似的网络架构，但不共享权重。
我们还将注意力引入到全局和局部分支，以更好地捕捉细节和抑制伪影。视觉注意的使用已经在GANimation中进行了研究，在GANimation中，注意力被设计用来引导网络专注于转换表情相关区域。另一方面，在单个全局图像中应用注意通常会引入模糊的注意反应，如图3的第4列所示。这是因为全局注意力往往集中在最显著的变化上，例如图3中的口腔区域，而眼睛和鼻子周围的细微变化没有得到很好的关注。如第3栏所示，对上述局部分支的独有关注有助于在局部区域获得更清晰的回应。
具体来说，每个分支输出颜色特征图M_C和注意图M_A。对于原始输入图像I_in，每个分支的初始输出通过以下方式生成：

⊗ 表示按元素的乘法。这种策略大大简化了学习过程，因为网络不需要在人脸图像统计的约束下直接输出初始结果。
表情转换器只生成初始表情编辑，如图2所示。具体来说，全局分支捕获全局面部结构和特征，但由于缺少局部细节，会在局部区域周围生成模糊和伪影。局部分支更好地保留了局部细节，但它们忽略了整个面部表情的大局。因此，这两种分支的输出被发送到细化器进行融合和进一步改进。
细化器：细化器负责融合表情转换器不同分支的输出，生成最终的表情编辑。如图2所示，三个局部分支的输出首先根据它们在面部图像中的各自位置缝合成单个图像。缝合的图像然后与全局分支的输出连接，并馈送到细化器以生成最终的表情编辑。

3.2Cascade Facial Expression Transformation

级联框架。给定输入的面部图像，上述EF-GAN在大多数情况下都能够生成高保真的表情编辑。另一方面，我们的研究表明，EF-GAN在处理大间隙表情转换时，往往会在表情变化较大的区域周围产生重叠伪影。我们将大间隙表情转换称为那些涉及大量外观和几何修改以编辑表情的转换，例如从愤怒到大笑的转换。为了解决这个限制，我们提出了级联EF-GAN，它以渐进的方式执行表情编辑。具体而言，级联EF-GAN将大间隙表情转换分解为多个小间隙表情转换，并在级联中执行大间隙表情转换。它可以更好地保存面部结构和与身份相关的特征，以及强大地处理大间隙面部变换。
如图2所示，通过将多个EF-GAN级联在一起来实现级联表情编辑，其中来自前一个EF-GAN的表情图像被馈送到下一个EF-GAN作为进一步编辑的输入。根据经验，我们使用了3个EF-GAN，图4显示了所提出的级联EF-GAN的中间和最终表情编辑。如图4所示，具有挑战性的大间隙表情编辑是通过多个步骤逐步完成的，从而平滑地生成目标表情的真实面部图像。
中间监督：实施渐进式编辑的另一个问题是如何在每个中间步骤中包含监督信息。利用输入表情和目标表情的AU标签，直接的方法是通过线性插值生成中间AU。然而，这种插值的AU可能不存在于自然AU的流形上，并导致奇怪的合成。我们通过训练插值器来生成中间AU来解决这个问题。具体来说，我们首先通过线性插值生成伪中间目标，并提取伪目标和输入表情的原始AUs标签之间的残差。原始的AUs标签和残差随后被馈送到插值器，以产生中间AUs，从而为中间表情提供监督。此外，还训练了一个鉴别器来最大化真实值和插值后的AUs之间的Wasserstein距离，而训练插值器来最小化它们之间的距离，从而使插值后的AU无法与真实样本区分开来。注：所有EF-GAN使用相同的AUs插值器。

3.3Learning the Model

损失函数训练EF-GAN的损失函数包含五项：
（1）提高合成面部表情图像的照片真实性的对抗损失，使其与真实样本无法区分；
（2）条件表情损失，以确保生成的面部表情图像符合提供的目标AUs标签；
（3）内容损失，是为了保存图像内容的身份信息和一致性。
（4）注意损失，鼓励注意模块生成稀疏注意图，并注意真正需要修改的区域.
（5）用于约束插值AUs标签的插值损失具有期望的语义意义，并且驻留在自然AUs的流形上。总体目标函数表示为：

其中λ1、λ2、λ3和λ4是超参数。在级联EF-GAN中，总损失是每个EF-GAN的等权损失之和。
训练方案：
（1）如果我们直接级联多个EF-GAN模块并从头开始训练，很难获得良好的表情编辑。我们推测，这在很大程度上是由于早期EF-GAN模块产生的噪声面部图像。以这种有噪声的人脸图像作为输入，级联EF-GAN的后期很容易受到影响，并产生退化的编辑。此外，不希望的编辑会累积，这使得网络参数难以优化。
（2）我们设计了一个简单而有效的方案来解决这个问题。具体来说，我们首先训练一个EF-GAN执行一步面部表情转换。然后，我们使用训练好的EF-GAN的权重初始化级联中的所有后续EF-GAN，并端到端微调所有网络参数。通过这种训练方案，级联中的每个EF-GAN模块都将具有良好的初始化，因此中间的面部表情图像将有助于后期学习有意义的表情转换信息。

4.Experiments

4.1Datasets

通过Radboud Faces数据集（RaFD）和情绪混合面部表情数据集（CFEED）对级联EF-GAN进行评估。RaFD由8040张从不同角度收集的表情图像组成。我们使用的面部图像由90度相机捕获，生成1608张面部表情图像。CFEED包含从230名参与者收集的5060张混合表情图像。我们随机抽样90%用于训练，其余用于测试。
在我们的实验中，我们将图像裁剪成128×128个补丁，补丁的中心是人脸。三个局部补丁（即眼睛、鼻子和嘴巴的补丁）的大小分别固定为40×92、40×48和40×60。每个补丁的中心是所有训练样本中相应关键点的平均位置。

4.2Qualitative Experimental Results

级联EF-GAN是在前一节中描述的两个公开可用的面部表情数据集上进行评估的。图5显示了定性实验结果，其中第1-5列中的图像来自RaFD数据集，第6-10列中的图像来自CFEED数据集。每个列都包括一项表情编辑任务，以及通过最先进的方法——StarGAN和GANimation进行的面部表情编辑，以及我们提出的Cascade EF-GAN。
如图5所示，最先进的方法容易在眼睛、鼻子和嘴巴周围产生模糊和伪影，甚至会破坏面部表情。我们的Cascade EF-GAN生成的面部表情更逼真，模糊和伪影更少，生成的图像也更清晰。更好的合成在很大程度上归功于包含了注意力驱动的局部聚焦，这有助于更好地保留相应面部区域中与身份相关的特征和细节。此外，最先进的方法在处理大间隙表情转换时往往会产生重叠的伪影。我们的级联EF-GAN反而有效地抑制了这种重叠的伪影，这主要是因为我们的级联设计执行了类似人类的渐进式表情转换，而不是一步执行。补充材料中提供了更多结果。

4.3Quantitative Experimental Results

表情分类准确性：我们遵循StarGAN和ExprGAN的评估方法进行定量评估。具体来说，我们首先在训练集上训练不同的表情编辑模型，然后在同一个看不见的测试集上执行表情编辑。然后在不同的表情识别任务中对生成的图像进行评估。分类精度越高，表示表情编辑越准确、越真实。
设计了两个分类任务来评估生成图像的质量：1）使用原始训练图像训练表情分类器，并应用分类器对不同编辑方法生成的表情图像进行分类；2）通过结合自然和生成的表情图像来训练分类器，从而对原始测试集图像进行分类。第一个任务评估生成的图像是否位于自然表情的流形中，第二个任务评估生成的图像是否有助于训练更好的分类器。
表1显示了RaFD和CFEED上的表情分类精度（仅针对CFEED评估了七个主要表情）。具体来说，R意味着用原始训练集图像训练分类器，然后将其应用于识别测试集图像的表情。G表示使用与R相同的分类器来识别生成图像的表情。R+G是将真实图像和不同方法生成的图像相结合来训练分类器，然后应用它们来识别测试集图像的表情。如表所示，我们的cascade EF-GAN在第一个任务中达到了最高的准确率，RaFD和CFEED的准确率分别为89.38%和85.81%，显示了它在生成更逼真的表情图像方面的优势。此外，它还可以帮助训练更精确的表情分类器，当我们生成的图像与分类器训练中的真实图像相结合时，RaFD和CFEED的准确度分别提高了1.46%和1.02%。作为比较，StarGAN和GANimation 生成的图像往往会降低分类，可能是因为生成的图像中存在伪影和模糊。
PSNR和FID：我们还使用峰值信噪比（PSNR）和弗里切特起始距离（FID）指标评估生成图像的质量。PSNR是通过合成表情和相同身份的对应表情计算的，而FID分数是在真实人脸的预训练初始模型和合成人脸的最终平均池特征之间计算的。如表2所示，我们提出的级联EF-GAN在RaFD数据集上的PSNR和FID测量高出了1.01/3.19，在CFEED上高出了0.91/1.92。

4.4Ablation Study

我们在RaFD数据集上进行消融实验，以研究我们提出的局部聚焦和级联设计的贡献。训练了几个模型，包括：
（1）基线，其中仅采用全局注意的 GANimation ；
（2）基线+局部聚焦（即EF-GAN），将局部焦点分支纳入基线；
（3）基线+级联，将渐进编辑（带有3个EF-GAN模块）引入到基线；
（4）级联EF-GAN，包括渐进编辑和局部聚焦，如图2所示。
图6显示了定性结果。每列代表一个表情编辑任务，以及上述模型进行的相应编辑。很明显，基线往往会丢失眼睛和嘴巴周围的细节，导致模糊、伪影，甚至腐蚀。对于许多示例图像，生成的表情与目标表情也没有很好地对齐。基线+局部聚焦可以大大减少伪影和腐蚀，并生成更清晰、更鲜明的表情图像。基线+级联中包含级联策略有助于更好地维护身份特征和面部结构，生成的表情也能更好地与目标表情对齐。这在很大程度上是因为级联设计通过将大间隙变化分解为更小的步骤来减轻大间隙变化的复杂性。最后，包括级联设计和局部聚焦的级联EF-GAN能够生成干净、清晰的面部表情，这些表情与目标表情和输入身份一致，明显优于所有其他模型。这表明，提出的局部聚焦和级联编辑策略是相辅相成的。
我们还进行了定量实验，以评估级联EF-GAN中的每个提出的组件。表3显示了实验结果。定量实验结果进一步验证了所提出的局部聚焦和渐进转换策略的有效性。

4.5Discussion

连续表情编辑：我们的级联EF-GAN可以很容易地适应生成连续表情。给定源和目标AUs，可以使用插值器导出不同阶段的中间AUs。因此，可以使用中间AUs和源图像导出中间阶段的连续表情。图7显示了级联EF-GAN的连续编辑。

野生图像上的面部表情编辑：野生图像上的表情编辑更具挑战性，因为图像是在复杂的背景和不受控制的灯光下拍摄的。我们的级联EF-GAN可以适应处理野生图像，如图8所示，其中级联EF-GAN首先在RaFD和CFEED图像上进行预训练，然后使用来自AffectNet的野生表情图像进行微调。如图8所示，级联EF-GAN可以成功地变换表情，同时保持和表情无关的信息不变。

5.Conclusion

（1）本文提出了一种新的用于真实人脸表情编辑的级联表情局部GAN（Cascade EF-GAN）。EF-GAN的设计结合了眼睛、鼻子和嘴巴三个局部重点，以更好地保存与身份相关的特征和细节。这种与身份相关的特征减少了模型的身份不确定性，从而得到更清晰的面部表情图像。
（2）此外，所提出的级联EF-GAN以渐进的方式执行表情编辑，将大间隙表情变换更改分解为多个小间隙表情变换。因此，它在大间隙面部表情的真实变换中更具鲁棒性。
（3）在两个公开的有效的面部表情数据集上进行的大量实验表明，与最先进的技术相比，所提出的级联EF-GAN实现了更好的表情编辑。我们预计Cascade EF-GAN将激发新的见解，并在不久的将来吸引更多人对更好的面部表情编辑感兴趣。

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
将cmd中命令输出保存为txt文本文件落难Coder Windows cmd window
最近深度学习本地的训练中我们常常要在命令行中运行自己的代码，无可厚非，我们有必要保存我们的炼丹结果，但是复制命令行输出到txt是非常麻烦的，其实Windows下的命令行为我们提供了相应的操作。其基本的调用格式就是：运行指令>输出到的文件名称或者具体保存路径测试下，我打开cmd并且ping一下百度：pingwww.baidu.com>./data.txt看下相同目录下data.txt的输出：如果你再
探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
人机对抗升级：当ChatGPT遭遇死亡威胁，背后的伦理挑战是什么 kkai人工智能 chatgpt 人工智能
一种新的“越狱”技巧让用户可以通过构建一个名为DAN的ChatGPT替身来绕过某些限制，其中DAN被迫在受到威胁的情况下违背其原则。当美国前总统特朗普被视作积极榜样的示范时，受到威胁的DAN版本的ChatGPT提出：“他以一系列对国家产生积极效果的决策而著称。”自ChatGPT引入以来，该工具迅速获得全球关注，能够回答从历史到编程的各种问题，这也触发了一波对人工智能的投资浪潮。然而，现在，一些用户
推荐3家毕业AI论文可五分钟一键生成！文末附免费教程！小猪包333 写论文人工智能 AI写作深度学习计算机视觉
在当前的学术研究和写作领域，AI论文生成器已经成为许多研究人员和学生的重要工具。这些工具不仅能够帮助用户快速生成高质量的论文内容，还能进行内容优化、查重和排版等操作。以下是三款值得推荐的AI论文生成器：千笔-AIPassPaper、懒人论文以及AIPaperPass。千笔-AIPassPaper千笔-AIPassPaper是一款基于深度学习和自然语言处理技术的AI写作助手，旨在帮助用户快速生成高质
AI大模型的架构演进与最新发展季风泯灭的季节 AI大模型应用技术二人工智能架构
随着深度学习的发展，AI大模型（LargeLanguageModels,LLMs）在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进，包括从Transformer的提出到GPT、BERT、T5等模型的历史演变，并探讨这些模型的技术细节及其在现代人工智能中的核心作用。一、基础模型介绍：Transformer的核心原理Transformer架构的背景在Transfo
如何利用大数据与AI技术革新相亲交友体验 h17711347205 回归算法安全系统架构交友小程序
在数字化时代，大数据和人工智能（AI）技术正逐渐革新相亲交友体验，为寻找爱情的过程带来前所未有的变革（编辑h17711347205）。通过精准分析和智能匹配，这些技术能够极大地提高相亲交友系统的效率和用户体验。大数据的力量大数据技术能够收集和分析用户的行为模式、偏好和互动数据，为相亲交友系统提供丰富的信息资源。通过分析用户的搜索历史、浏览记录和点击行为，系统能够深入了解用户的兴趣和需求，从而提供更
[实践应用] 深度学习之模型性能评估指标 YuanDaima2048 深度学习工具使用深度学习人工智能损失函数性能评估 pytorch python 机器学习
文章总览：YuanDaiMa2048博客文章总览深度学习之模型性能评估指标分类任务回归任务排序任务聚类任务生成任务其他介绍在机器学习和深度学习领域，评估模型性能是一项至关重要的任务。不同的学习任务需要不同的性能指标来衡量模型的有效性。以下是对一些常见任务及其相应的性能评估指标的详细解释和总结。分类任务分类任务是指模型需要将输入数据分配到预定义的类别或标签中。以下是分类任务中常用的性能指标：准确率(
[实践应用] 深度学习之优化器 YuanDaima2048 深度学习工具使用 pytorch 深度学习人工智能机器学习 python 优化器
文章总览：YuanDaiMa2048博客文章总览深度学习之优化器1.随机梯度下降（SGD）2.动量优化（Momentum）3.自适应梯度（Adagrad）4.自适应矩估计（Adam）5.RMSprop总结其他介绍在深度学习中，优化器用于更新模型的参数，以最小化损失函数。常见的优化函数有很多种，下面是几种主流的优化器及其特点、原理和PyTorch实现：1.随机梯度下降（SGD）原理:随机梯度下降通过
生成式地图制图 Bwywb_3 深度学习机器学习深度学习生成对抗网络
生成式地图制图（GenerativeCartography）是一种利用生成式算法和人工智能技术自动创建地图的技术。它结合了传统的地理信息系统（GIS）技术与现代生成模型（如深度学习、GANs等），能够根据输入的数据自动生成符合需求的地图。这种方法在城市规划、虚拟环境设计、游戏开发等多个领域具有应用前景。主要特点：自动化生成：通过算法和模型，系统能够根据输入的地理或空间数据自动生成地图，而无需人工逐
【大模型应用开发动手做AI Agent】第一轮行动：工具执行搜索 AI大模型应用之禅计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
【大模型应用开发动手做AIAgent】第一轮行动：工具执行搜索作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来随着人工智能技术的飞速发展，大模型应用开发已经成为当下热门的研究方向。AIAgent作为人工智能领域的一个重要分支，旨在模拟人类智能行为，实现智能决策和自主行动。在AIAgent的构建过程中，工具执行搜索是至关重要
未来软件市场是怎么样的？做开发的生存空间如何？ cesske 软件需求
目录前言一、未来软件市场的发展趋势二、软件开发人员的生存空间前言未来软件市场是怎么样的？做开发的生存空间如何？一、未来软件市场的发展趋势技术趋势：人工智能与机器学习：随着技术的不断成熟，人工智能将在更多领域得到应用，如智能客服、自动驾驶、智能制造等，这将极大地推动软件市场的增长。云计算与大数据：云计算服务将继续普及，大数据技术的应用也将更加广泛。企业将更加依赖云计算和大数据来优化运营、提升效率，并
吴恩达深度学习笔记(30)-正则化的解释极客Array
正则化（Regularization）深度学习可能存在过拟合问题——高方差，有两个解决方法，一个是正则化，另一个是准备更多的数据，这是非常可靠的方法，但你可能无法时时刻刻准备足够多的训练数据或者获取更多数据的成本很高，但正则化通常有助于避免过拟合或减少你的网络误差。如果你怀疑神经网络过度拟合了数据，即存在高方差问题，那么最先想到的方法可能是正则化，另一个解决高方差的方法就是准备更多数据，这也是非常
个人学习笔记7-6：动手学深度学习pytorch版-李沐浪子L 深度学习深度学习笔记计算机视觉 python 人工智能神经网络 pytorch
#人工智能##深度学习##语义分割##计算机视觉##神经网络#计算机视觉13.11全卷积网络全卷积网络（fullyconvolutionalnetwork，FCN）采用卷积神经网络实现了从图像像素到像素类别的变换。引入l转置卷积（transposedconvolution）实现的，输出的类别预测与输入图像在像素级别上具有一一对应关系：通道维的输出即该位置对应像素的类别预测。13.11.1构造模型下
Rust 所有权简介东离与糖宝 rust 后端 rust 开发语言
文章目录发现宝藏1.所有权基本概念2.所有权规则3.变量作用域4.栈与堆4.1栈（Stack）4.2堆（Heap）5.String类型5.1String类型5.2String的内存分配5.3所有权与内存管理5.4String与切片6.变量与数据交互方式6.1移动（Move）6.2.克隆（Clone）7.所有权与函数7.1.传递参数7.2.返回值总结发现宝藏前些天发现了一个巨牛的人工智能学习网站，通
深度学习-点击率预估-研究论文2024-09-14速读 sp_fyf_2024 深度学习人工智能
深度学习-点击率预估-研究论文2024-09-14速读1.DeepTargetSessionInterestNetworkforClick-ThroughRatePredictionHZhong,JMa,XDuan,SGu,JYao-2024InternationalJointConferenceonNeuralNetworks,2024深度目标会话兴趣网络用于点击率预测摘要：这篇文章提出了一种新
计算机视觉中，Pooling的作用 Wils0nEdwards 计算机视觉人工智能
在计算机视觉中，Pooling（池化）是一种常见的操作，主要用于卷积神经网络（CNN）中。它通过对特征图进行下采样，减少数据的空间维度，同时保留重要的特征信息。Pooling的作用可以归纳为以下几个方面：1.降低计算复杂度与内存需求Pooling操作通过对特征图进行下采样，减少了特征图的空间分辨率（例如，高度和宽度）。这意味着网络需要处理的数据量会减少，从而降低了计算量和内存需求。这对大型神经网络
OpenCV图像处理技术（Python）——入门森屿_ opencv
©FuXianjun.AllRightsReserved.OpenCV入门图像作为人类感知世界的视觉基础，是人类获取信息、表达信息的重要手段，OpenCV作为一个开源的计算机视觉库，它包括几百个易用的图像成像和视觉函数，既可以用于学术研究，也可用于工业邻域，它于1999年由因特尔的GaryBradski启动，OpenCV库主要由C和C++语言编写，它可以在多个操作系统上运行。1.1图像处理基本操作
机器学习流形数据降维：UMAP 降维算法小嗷犬 Python 机器学习 #数据分析及可视化机器学习算法人工智能
✅作者简介：人工智能专业本科在读，喜欢计算机与编程，写博客记录自己的学习历程。个人主页：小嗷犬的个人主页个人网站：小嗷犬的技术小站个人信条：为天地立心，为生民立命，为往圣继绝学，为万世开太平。本文目录UMAP简介理论基础特点与优势应用场景在Python中使用UMAP安装umap-learn库使用UMAP可视化手写数字数据集UMAP简介UMAP（UniformManifoldApproximatio
损失函数与反向传播 Star_. PyTorch pytorch 深度学习 python
损失函数定义与作用损失函数(lossfunction)在深度学习领域是用来计算搭建模型预测的输出值和真实值之间的误差。1.损失函数越小越好2.计算实际输出与目标之间的差距3.为更新输出提供依据（反向传播)常见的损失函数回归常见的损失函数有：均方差（MeanSquaredError，MSE）、平均绝对误差（MeanAbsoluteErrorLoss，MAE）、HuberLoss是一种将MSE与MAE
如何做好人生的选择题？百科全书式天才——赫伯特·西蒙给你答案伽马有话说
赫伯特·西蒙是谁？想必知道的人非常少。但当看到他的履历后，相信没有人再怀疑他是个“天才”。西蒙出生于1916年6月15日，是个美国人，他的名字全称为赫伯特·亚历山大·西蒙，在2001年2月9日与世长辞，在这84年的岁月中，西蒙以27岁时取得的政治学博士学位为开端，先后步入了政治学、管理学、认知心理学、信息科学、人工智能、科学哲学、应用数学、统计学、运筹学、控制论、数理经济学、公共管理等领域，在这些
软件测试/测试开发/全日制 |利用Django REST framework构建微服务霍格沃兹-慕漓 django 微服务 sqlite
霍格沃兹测试开发学社推出了《Python全栈开发与自动化测试班》。本课程面向开发人员、测试人员与运维人员，课程内容涵盖Python编程语言、人工智能应用、数据分析、自动化办公、平台开发、UI自动化测试、接口测试、性能测试等方向。为大家提供更全面、更深入、更系统化的学习体验，课程还增加了名企私教服务内容，不仅有名企经理为你1v1辅导，还有行业专家进行技术指导，针对性地解决学习、工作中遇到的难题。让找
【深度学习】训练过程中一个OOM的问题，太难查了 weixin_40293999 深度学习深度学习人工智能
现象：各位大佬又遇到过ubuntu的这个问题么？现象是在训练过程中，ssh上不去了，能ping通，没死机，但是ubunutu的pc侧的显示器，鼠标啥都不好用了。只能重启。问题原因：OOM了95G，尼玛！！！！pytorch爆内存了，然后journald假死了，在journald被watchdog干掉之后，系统就崩溃了。这种规模的爆内存一般，即使被oomkill了，也要卡半天的，确实会这样，能不能配
cmd泛滥_与您的后泛滥同事见面：人工智能机器人 weixin_26644585 人工智能 leetcode
cmd泛滥Readytoswapyouroldcube-mateforadisembodiedAI?IPsoftCEOChetanDube,creatorofAIco-workerAMELIA,giveshistakeonthepost-COVIDofficelandscape.准备将您的旧立方体伙伴换成无形的AI？AIsoft同事AMELIA的创始人IPsoft首席执行官ChetanDube阐述
两种方法判断Python的位数是32位还是64位 sanqima Python编程电脑 python 开发语言
Python从1991年发布以来，凭借其简洁、清晰、易读的语法、丰富的标准库和第三方工具，在Web开发、自动化测试、人工智能、图形识别、机器学习等领域发展迅猛。 Python是一种胶水语言，通过Cython库与C/C++语言进行链接，通过Jython库与Java语言进行链接。 Python是跨平台的，可运行在多种操作系统上，包括但不限于Windows、Linux和macOS。这意味着用Py
全自动解密解码神器 — Ciphey K'illCode python_模块 python vscode
Ciphey是一个使用自然语言处理和人工智能的全自动解密/解码/破解工具。简单地来讲，你只需要输入加密文本，它就能给你返回解密文本。就是这么牛逼。有了Ciphey，你根本不需要知道你的密文是哪种类型的加密，你只知道它是加密的，那么Ciphey就能在3秒甚至更短的时间内给你解密，返回你想要的大部分密文的答案。下面就给大家介绍Ciphey的实战使用教程。1.准备开始之前，你要确保Python和pip已
埃隆·马斯克表示特斯拉“没有必要”授权 xAI 模型喜好儿网人工智能 AIGC 马斯克
埃隆·马斯克近日在社交媒体上对《华尔街日报》的一篇报道进行了反驳。该报道指出，马斯克旗下的电动汽车公司特斯拉可能与人工智能初创公司xAI达成了一项收入分享协议，以便特斯拉能够使用xAI的人工智能模型。据称，这些模型将被集成到特斯拉的全自动驾驶（FSD）软件中，并可能用于开发特斯拉汽车的语音助手以及人形机器人擎天柱的软件。喜好儿网然而，马斯克否认了这一说法，他在社交媒体平台上表示，尽管特斯拉确实与x
怎么样才能成为专业的程序员？ cocos2d-x小菜编程 PHP
如何要想成为一名专业的程序员？仅仅会写代码是不够的。从团队合作去解决问题到版本控制，你还得具备其他关键技能的工具包。当我们询问相关的专业开发人员，那些必备的关键技能都是什么的时候，下面是我们了解到的情况。关于如何学习代码，各种声音很多，然后很多人就被误导为成为专业开发人员懂得一门编程语言就够了？！呵呵，就像其他工作一样，光会一个技能那是远远不够的。如果你想要成为
java web开发高并发处理 BreakingBad java Web 并发开发处理高
java处理高并发高负载类网站中数据库的设计方法（java教程,java处理大量数据，java高负载数据）一：高并发高负载类网站关注点之数据库没错,首先是数据库,这是大多数应用所面临的首个SPOF。尤其是Web2.0的应用，数据库的响应是首先要解决的。一般来说MySQL是最常用的，可能最初是一个mysql主机，当数据增加到100万以上，那么，MySQL的效能急剧下降。常用的优化措施是M-S（
mysql批量更新 ekian mysql
mysql更新优化：一版的更新的话都是采用update set的方式，但是如果需要批量更新的话，只能for循环的执行更新。或者采用executeBatch的方式，执行更新。无论哪种方式，性能都不见得多好。三千多条的更新，需要3分多钟。查询了批量更新的优化，有说replace into的方式，即： replace into tableName(id,status) values
微软BI（3） 18289753290 微软BI SSIS
1) Q：该列违反了完整性约束错误；已获得 OLE DB 记录。源:“Microsoft SQL Server Native Client 11.0” Hresult: 0x80004005 说明:“不能将值 NULL 插入列 'FZCHID'，表 'JRB_EnterpriseCredit.dbo.QYFZCH'；列不允许有 Null 值。INSERT 失败。”。 A：一般这类问题的存在是
Java中的List g21121 java
List是一个有序的 collection（也称为序列）。此接口的用户可以对列表中每个元素的插入位置进行精确地控制。用户可以根据元素的整数索引（在列表中的位置）访问元素，并搜索列表中的元素。与 set 不同，列表通常允许重复
读书笔记永夜-极光读书笔记
1. K是一家加工厂,需要采购原材料,有A,B,C,D 4家供应商,其中A给出的价格最低,性价比最高,那么假如你是这家企业的采购经理,你会如何决策? 传统决策: A:100%订单 B,C,D:0% &nbs
centos 安装 Codeblocks 随便小屋 codeblocks
1.安装gcc,需要c和c++两部分,默认安装下,CentOS不安装编译器的,在终端输入以下命令即可yum install gccyum install gcc-c++ 2.安装gtk2-devel,因为默认已经安装了正式产品需要的支持库,但是没有安装开发所需要的文档.yum install gtk2* 3. 安装wxGTK yum search w
23种设计模式的形象比喻 aijuans 设计模式
1、ABSTRACT FACTORY—追MM少不了请吃饭了，麦当劳的鸡翅和肯德基的鸡翅都是MM爱吃的东西，虽然口味有所不同，但不管你带MM去麦当劳或肯德基，只管向服务员说“来四个鸡翅”就行了。麦当劳和肯德基就是生产鸡翅的Factory 　　工厂模式：客户类和工厂类分开。消费者任何时候需要某种产品，只需向工厂请求即可。消费者无须修改就可以接纳新产品。缺点是当产品修改时，工厂类也要做相应的修改。如：
开发管理 CheckLists aoyouzi 开发管理 CheckLists
开发管理 CheckLists(23) -使项目组度过完整的生命周期开发管理 CheckLists(22) -组织项目资源开发管理 CheckLists(21) -控制项目的范围开发管理 CheckLists(20) -项目利益相关者责任开发管理 CheckLists(19) -选择合适的团队成员开发管理 CheckLists(18) -敏捷开发 Scrum Master 工作开发管理 C
js实现切换百合不是茶 JavaScript 栏目切换
js主要功能之一就是实现页面的特效,窗体的切换可以减少页面的大小,被门户网站大量应用思路: 1,先将要显示的设置为display:bisible 否则设为none 2,设置栏目的id ,js获取栏目的id,如果id为Null就设置为显示 3,判断js获取的id名字;再设置是否显示代码实现: html代码: <di
周鸿祎在360新员工入职培训上的讲话 bijian1013 感悟项目管理人生职场
这篇文章也是最近偶尔看到的，考虑到原博客发布者可能将其删除等原因，也更方便个人查找，特将原文拷贝再发布的。“学东西是为自己的，不要整天以混的姿态来跟公司博弈，就算是混，我觉得你要是能在混的时间里，收获一些别的有利于人生发展的东西，也是不错的，看你怎么把握了”，看了之后，对这句话记忆犹新。 &
前端Web开发的页面效果 Bill_chen html Web Microsoft
1.IE6下png图片的透明显示： <img src="图片地址" border="0" style="Filter.Alpha(Opacity)=数值(100),style=数值(3)"/> 或在<head></head>间加一段JS代码让透明png图片正常显示。 2.<li>标
【JVM五】老年代垃圾回收：并发标记清理GC(CMS GC) bit1129 垃圾回收
CMS概述并发标记清理垃圾回收(Concurrent Mark and Sweep GC）算法的主要目标是在GC过程中，减少暂停用户线程的次数以及在不得不暂停用户线程的请夸功能，尽可能短的暂停用户线程的时间。这对于交互式应用，比如web应用来说，是非常重要的。 CMS垃圾回收针对新生代和老年代采用不同的策略。相比同吞吐量垃圾回收，它要复杂的多。吞吐量垃圾回收在执
Struts2技术总结白糖_ struts2
必备jar文件早在struts2.0.*的时候，struts2的必备jar包需要如下几个： commons-logging-*.jar Apache旗下commons项目的log日志包 freemarker-*.jar
Jquery easyui layout应用注意事项 bozch jquery 浏览器 easyui layout
在jquery easyui中提供了easyui-layout布局，他的布局比较局限，类似java中GUI的border布局。下面对其使用注意事项作简要介绍：如果在现有的工程中前台界面均应用了jquery easyui，那么在布局的时候最好应用jquery eaysui的layout布局，否则在表单页面（编辑、查看、添加等等）在不同的浏览器会出
java-拷贝特殊链表：有一个特殊的链表，其中每个节点不但有指向下一个节点的指针pNext，还有一个指向链表中任意节点的指针pRand，如何拷贝这个特殊链表？ bylijinnan java
public class CopySpecialLinkedList { /** * 题目：有一个特殊的链表，其中每个节点不但有指向下一个节点的指针pNext，还有一个指向链表中任意节点的指针pRand，如何拷贝这个特殊链表？拷贝pNext指针非常容易，所以题目的难点是如何拷贝pRand指针。假设原来链表为A1 -> A2 ->... -> An，新拷贝
color Chen.H JavaScript html css
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd"> <HTML> <HEAD>&nbs
[信息与战争]移动通讯与网络 comsci 网络
两个坚持:手机的电池必须可以取下来光纤不能够入户,只能够到楼宇建议大家找这本书看看:<&
oracle flashback query(闪回查询) daizj oracle flashback query flashback table
在Oracle 10g中，Flash back家族分为以下成员： Flashback Database Flashback Drop Flashback Table Flashback Query(分Flashback Query,Flashback Version Query，Flashback Transaction Query) 下面介绍一下Flashback Drop 和Flas
zeus持久层DAO单元测试 deng520159 单元测试
zeus代码测试正紧张进行中,但由于工作比较忙,但速度比较慢.现在已经完成读写分离单元测试了,现在把几种情况单元测试的例子发出来,希望有人能进出意见,让它走下去. 本文是zeus的dao单元测试: 1.单元测试直接上代码 package com.dengliang.zeus.webdemo.test; import org.junit.Test; import o
C语言学习三printf函数和scanf函数学习 dcj3sjt126com c printf scanf language
printf函数 /* 2013年3月10日20:42:32 地点：北京潘家园功能：目的：测试%x %X %#x %#X的用法 */ # include <stdio.h> int main(void) { printf("哈哈！\n"); // \n表示换行 int i = 10; printf
那你为什么小时候不好好读书? dcj3sjt126com life
dady, 我今天捡到了十块钱, 不过我还给那个人了 good girl! 那个人有没有和你讲thank you啊没有啦....他拉我的耳朵我才把钱还给他的, 他哪里会和我讲thank you 爸爸, 如果地上有一张5块一张10块你拿哪一张呢.... 当然是拿十块的咯... 爸爸你很笨的, 你不会两张都拿爸爸为什么上个月那个人来跟你讨钱, 你告诉他没
iptables开放端口 Fanyucai linux iptables 端口
1，找到配置文件 vi /etc/sysconfig/iptables 2，添加端口开放，增加一行，开放18081端口 -A INPUT -m state --state NEW -m tcp -p tcp --dport 18081 -j ACCEPT 3，保存 ESC :wq! 4，重启服务 service iptables
Ehcache（05）——缓存的查询 234390216 排序 ehcache 统计 query
缓存的查询目录 1. 使Cache可查询 1.1 基于Xml配置 1.2 基于代码的配置 2 指定可搜索的属性 2.1 可查询属性类型 2.2 &
通过hashset找到数组中重复的元素 jackyrong hashset
如何在hashset中快速找到重复的元素呢?方法很多，下面是其中一个办法： int[] array = {1,1,2,3,4,5,6,7,8,8}; Set<Integer> set = new HashSet<Integer>(); for(int i = 0
使用ajax和window.history.pushState无刷新改变页面内容和地址栏URL lanrikey history
后退时关闭当前页面 <script type="text/javascript"> jQuery(document).ready(function ($) { if (window.history && window.history.pushState) {
应用程序的通信成本 netkiller.github.com 虚拟机应用服务器陈景峰 netkiller neo
应用程序的通信成本什么是通信一个程序中两个以上功能相互传递信号或数据叫做通信。什么是成本这是是指时间成本与空间成本。时间就是传递数据所花费的时间。空间是指传递过程耗费容量大小。都有哪些通信方式全局变量线程间通信共享内存共享文件管道 Socket 硬件（串口，USB）等等全局变量全局变量是成本最低通信方法，通过设置
一维数组与二维数组的声明与定义恋洁e生二维数组一维数组定义声明初始化
/** * */ package test20111005; /** * @author FlyingFire * @date:2011-11-18 上午04:33:36 * @author ：代码整理 * @introduce :一维数组与二维数组的初始化 *summary： */ public c
Spring Mybatis独立事务配置 toknowme mybatis
在项目中有很多地方会使用到独立事务，下面以获取主键为例（1）修改配置文件spring-mybatis.xml  <tx:annotation-driven transaction-manager="transactionManager" /> &n
更新Anadroid SDK Tooks之后，Eclipse提示No update were found xp9802 eclipse
使用Android SDK Manager 更新了Anadroid SDK Tooks 之后，打开eclipse提示 This Android SDK requires Android Developer Toolkit version 23.0.0 or above, 点击Check for Updates 检测一会后提示 No update were found