小段学长

使用周期一致的对抗网络进行不成对的图像到图像转换

图 1：给定任意两个无序图像集合 X 和 Y，我们的算法学习自动将图像从一个图像“翻译”到另一个图像，反之亦然，示例应用程序（底部）：使用著名艺术家的画作集，学习将用户的照片渲染成他们的风格。

摘要

图像到图像转换是一类视觉和图形问题，其目标是学习之间的映射输入图像和输出图像使用训练集对齐的图像对。但是，对于许多任务，配对的训练数据将不可用。我们提出了一种方法学习将图像从源域 X 转换为目标域 Y 在没有配对示例的情况下。我们的目标是学习映射 G ： X → Y 使得分布来自 G（X）的图像与使用对抗性损失的分布 Y 无法区分。因为此映射是高度约束不足，我们将其与逆映射 F ： Y → X 耦合，并将循环一致性损失引入将 F（G（X）） ≈ X 推（反之亦然）。定性结果是在多个任务中呈现，其中配对的训练数据具有不存在，包括收藏风格转移、对象变形、季节转移、照片增强等。定量的与几种先前方法的比较表明我们方法的优越性。

1. 介绍

克劳德·莫奈在将画架放在阿让特伊附近的塞纳河畔，在一个可爱的春日里1873年（图1，左上角）一张彩色照片，如果是
发明，可能已经记录了一片湛蓝的天空和玻璃状河流倒映着它。莫奈表达了他对同样的印象场景通过轻柔的笔触和明亮的调色板。什么如果莫奈碰巧在卡西斯的小港口上凉爽的夏夜（图1，左下角）短暂漫步通过莫奈绘画画廊，让人很容易想象他将如何渲染场景：也许是粉彩阴影，带有突兀的油漆并且有点扁平动态范围。
我们可以想象这一切，尽管从未见过一个侧面场景照片旁边的莫奈画作的侧面示例他画了。相反，我们了解了莫奈的集合绘画和风景照片集。我们可以关于这两组之间的文体差异的原因，从而想象一下，如果我们是这样的场景，那会是什么样子。将其从一个集合“翻译”到另一个集合。

图 2：配对训练数据（左）由训练示例组成
{xi， yi}Ni=1，其中对应于每个 xi 的 yi 被给出 [20]。我们而是考虑由源集组成的未配对训练数据（右图）{xi}Ni=1 ∈ X 和目标集 {yj}Mj=1 ∈ Y ，未提供信息至于哪个 xi 匹配哪个 yj 。
在本文中，我们提出了一个可以学习执行相同：捕获一个图像集合的特殊特征并弄清楚如何翻译这些特征进入其他图像集合，全部在没有任何配对的情况下训练示例。
这个问题可以更广泛地描述为图像图像转换[20]，将图像从给定场景x的一种表示转换为另一种表示，y，例如灰度。到颜色，图像到语义标签，边缘映射到照片。在计算机视觉、图像处理和图形在监督设置中产生了强大的转换系统，其中示例图像对 {x， y} 可用（图 2 左），例如 [9， 17， 20， 21， 24， 29， 41， 52， 54， 57]。但是，获取配对训练数据可能很困难，并且贵。例如，仅存在几个数据集像语义分割这样的任务（例如，[4]），它们相对较小。获取图形任务的输入-输出对像艺术风格化可能更加困难，因为所需的输出非常复杂，通常需要艺术性创作。对于许多任务，如对象变形（例如，斑马→马，图1中上），所需输出不是甚至定义明确。
因此，我们寻求一种可以学习翻译的算法。在没有成对输入-输出示例的域之间（图 2，右）。我们假设存在某种潜在的关系域之间 – 例如，它们是两个不同的域同一潜在世界的渲染 - 并寻求学习这种关系。虽然我们缺乏形式的监督的成对示例，我们可以在以下级别上利用监督：集合：我们在域 X 中给定一组图像，在域 Y 中给定另一组图像。我们可以训练一个映射 G ： X → Y使得输出 yˆ = G（x），x ∈ X，是不可区分的从图像 y ∈ Y 由经过训练的对手将 yˆ 分开从 y.从理论上讲，该目标可以诱导与经验分布 pY （y）相匹配的 yˆ 上的输出分布（in一般情况下，这要求 G 是随机的）[14]。最佳因此，G 将域 X 转换为分布域 Yˆ与 Y 相同。但是，这样的转换并不能保证单个输入和输出 x 和 y 是配对的以有意义的方式向上 - 有无限多的映射G 将在 yˆ 上诱导相同的分布。此外，在实践中，我们发现很难优化对抗孤立的目标：标准程序通常会导致众所周知的模式崩溃问题，其中所有输入图像映射到相同的输出图像，优化失败取得进步[13]。
这些问题要求为我们的目标增加更多的结构。
因此，我们利用翻译应该是“周期一致”，从某种意义上说，如果我们翻译，例如，一个句子从英语到法语，然后将其翻译回来从法语到英语，我们应该回到原来的句子[3]。从数学上讲，如果我们有一个转换器G：X→Y和另一个转换器F：Y→X，那么G和F应该彼此反转，并且两个映射都应该是双射。我们通过训练来应用这种结构假设同时映射 G 和 F，并添加一个循环一致性损失 [60]，鼓励 F（G（x）） ≈ x 和G（F（y）） ≈ y.将这种损失与对抗性损失结合起来在域 X 和 Y 上，我们实现了未配对的完整目标图像到图像的翻译。
我们将我们的方法应用于广泛的应用，包括样式转移，对象变形，属性转移和照片增强。我们还与以前的比较依赖于手动定义的因式分解的方法样式和内容，或共享嵌入功能，并显示我们的方法优于这些基线。我们的代码可在https://github.com/junyanz/CycleGAN。在 https://arxiv.org/abs/1703.10593.
查看论文的完整版本。

2. 相关研究

生成对抗网络（GAN）[14，58]有在图像生成 [5， 35]、图像方面取得了令人印象深刻的效果编辑[61]和表示学习[35，39，33]。最近方法采用相同的想法进行条件图像生成应用程序，例如 text2image [36]、图像内嵌 [34]、和未来预测[32]，以及其他领域，如视频 [50] 和 3D 模型 [53]。GAN成功的关键是强制生成图像的对抗性损失的想法原则上，与真实图像无法区分。这对于图像生成任务特别强大，因为这正是许多计算机图形学的目标优化。我们采用对抗性损失来学习映射使得翻译后的图像无法与目标域中的图像。图像到图像的转换图像到图像的思想翻译至少可以追溯到赫兹曼等人的图像类比[17]，他们使用非参数纹理。模型 [8] 在单个输入-输出训练图像对上。最近更多的方法使用输入输出示例的数据集来使用 CNN 学习参数化平移函数，例如 [29]。我们的方法建立在Isola et的“pix2pix”框架之上。[20]，它使用条件生成对抗网络[14]来学习从输入到输出图像的映射。类似的想法已被应用于各种任务，例如从草图[40]或从属性和语义布局 [22].。但是，与这些先前的作品不同，我们学习映射，无需配对训练示例。
未配对的图像到图像转换其他几个方法还可以解决不成对的设置，其目标是关联两个数据域，X 和 Y 。罗萨莱斯等人[37]提出一个贝叶斯框架，包括一个基于基于补丁的马尔可夫随机场的先验，从源图像计算出来，以及从多个样式图像获得的可能性项。最近，耦合GAN [28]和跨模态场景网络 [1] 使用权重共享策略来学习一个共同的跨域表示。与我们的方法并行，Liu等人[27]通过组合扩展了这个框架。变分自动编码器 [23] 和生成对抗网络。另一条并行工作线[42，45，2]鼓励输入和输出共享某些“内容”功能。即使它们在“风格”上可能有所不同。他们还使用对抗性网络，并附加条款来强制执行输出。接近预定义的度量空间中的输入，例如作为类标签空间 [2]、图像像素空间 [42] 和图像特征空间 [45]。
与上述方法不同，我们的配方不依赖于在任何特定于任务的预定义相似性函数上输入和输出，我们也不假设输入和输出必须位于同一个低维嵌入空间中。这使得我们的方法成为许多人的通用解决方案。视觉和图形任务。我们直接与几个进行比较第 5.1 节中的先前方法。与我们的工作同时，在同样，Yi等人[55]独立介绍不成对的图像到图像翻译的类似目标，灵感来自机器翻译中的对偶学习[15]。
循环一致性使用传递性作为一种方式的想法规范结构化数据具有悠久的历史。在视觉跟踪中，强制实施简单的向前向后一致性几十年来的标准伎俩[44]。在语言域中，通过“回溯翻译和改进翻译和改进翻译重新协调“是人工翻译人员使用的一种技术 [3]（幽默地包括马克吐温[47]），以及通过机器 [15].最近，高阶循环一致性已被用于运动结构[56]，3D形状匹配 [19]、共分割 [51]、密集语义对齐 [59， 60] 和深度估计 [12]。其中，周等人[60]和Godar等人[12]与我们的工作最相似，因为他们使用循环一致性损失作为使用传递性的一种方式监督CNN培训。在这项工作中，我们引入了一个类似的损失推动G和F彼此一致。
神经风格转移 [11， 21， 48， 10] 是另一种方式以执行图像到图像转换，这将合成通过将一个图像的内容与另一幅图像（通常是一幅画）的样式，通过匹配预先训练的深层特征的Gram矩阵统计。我们的主要另一方面，重点是学习两者之间的映射域，而不是在两个特定图像之间，通过尝试捕获更高级别外观之间的对应关系结构。因此，我们的方法可应用于其他任务，如绘画→照片，物体变形等。其中单个样品转移方法表现不佳。我们在第 5.2 节中比较了这两种方法。

图 3：（a）我们的模型包含两个映射函数 G ： X → Y 和 F ： Y → X，以及相关的对抗性鉴别器 DY 和 DX。断续器鼓励 G 将 X 转换为与域 Y 无法区分的输出，反之亦然，用于 DX、F 和 X。为了进一步规范映射，我们引入两个“周期一致性损失”，它们抓住了一种直觉，即如果我们从一个域转换到另一个域，然后再转换回来，我们应该到达我们的地方。开始：（b）前向循环一致性损失：x → G（x） → F（G（x）） ≈ x，以及（c）后向循环一致性损失：y → F（y） → G（F（y）） ≈ y

3. 配方

我们的目标是学习两个域 X 和 Y 之间的映射函数，给定训练样本 {xi}Ni=1 ∈ X 和{yj}Mj=1 ∈ Y 。如图3（a）所示，我们的模型包括两个映射G：X→Y和F：Y→X。此外，我们引入了两个对抗性鉴别器DX和
DY ，其中 DX 旨在区分图像 {x} 和翻译图像 {F（y）}；同样，DY旨在区分{y}和{G（x）}。我们的目标包含两项的种类：对抗性损失[14]，用于匹配将生成的图像分发到数据分发目标域;和一个循环一致性损失，以防止从相互矛盾中学习映射 G 和 F。

3.1对抗性损失

我们将对抗性损失 [14] 应用于两个映射函数。对于映射函数 G ： X → Y 及其鉴别器DY，我们将目标表示为：

其中 G 尝试生成与域 Y 中的图像相似的图像 G（x），而 DY 旨在区分已翻译的样本 G（x）和真实样本 y。我们介绍一个映射函数 F ： Y → X 的类似对抗性损失以及其鉴别器DX：即LGAN（F，DX，Y，X）。

3.2循环一致性损失

从理论上讲，对抗训练可以学习映射G和产生输出的输出分别与目标域 Y 和 X 相同（严格地说，这需要G 和 F 将是随机函数） [13]。但是，与大型容量足够，一个网络可以映射同一组输入图像到目标中图像的任何随机排列域，其中，任何学习的映射都可以诱导与目标分布匹配的输出分布。进一步减少可能的映射函数的空间，我们认为学习的映射函数应与周期一致：如图 3 （b）所示，对于域 X 中的每个图像 x，图像翻译周期应该能够将 x 带回原始图像，即 x → G（x） → F（G（x）） ≈ x。我们称之为正向循环一致性。同样，如图 3 所示（c），对于域Y、G和F中的每个图像y，还应满足向后循环一致性：y →F（y） →G（F（y）） ≈ y。我们可以使用循环一致性来激励这种行为损失：

在初步实验中，我们还尝试更换L1范数在此损失中与 F（G（x））之间的对抗性损失
和 x，以及 G（F（y））和 y 之间，但没有观察到性能的提高。在 arXiv 版本中可以观察到由循环一致性损失引起的行为。

3.3完整目标

我们的完整目标是：

其中 λ 控制两个目标的相对重要性。
我们的目标是解决：

请注意，我们的模型可以被视为训练两个“自动编码器”[18]：我们学习一个自动编码器F ◦ G ： X → X与另一个 G ◦ F ： Y → Y 联合使用。但是，这些自动编码器各自具有特殊的内部结构：它们映射图像通过中间表示到自身，该表示是将图像转换为另一个域。这样的设置也可以被视为“对抗性自动编码器”的特例[30]，使用对抗性损失来训练瓶颈层的自动编码器以匹配任意目标分布。在我们的例子中，X → X 自动编码器的目标分布是域 Y 的分布。在第 5.1.3 节中，我们比较了我们的方法反对全目标的消融，并经验表明两个目标在到达时起着关键作用高质量的结果。

4. 实现

网络架构：我们调整架构以适应我们的架构来自Johnson等人的生成网络[21]，他们有在神经风格转移和超分辨率方面显示出令人印象深刻的结果。该网络包含两个步幅 2 卷积，几个残余块 [16]和两个 12步幅卷积。与 Johnson 等人 [21] 类似，我们使用实例规范化 [49]。对于鉴别器网络，我们使用70×70个PatchGAN [20，26，25]，旨在对70×70进行分类。重叠的图像补丁是真的还是假的。这样的补丁级别鉴别器架构的参数比完全图像鉴别器少，可以应用于任意大小的完全卷积方式的图像[20]。
培训细节我们应用了最近的两种技术致力于稳定我们的模型训练过程。首先，对于LGAN（等式1），我们替换负对数似然目标由最小二乘损失[31]。这种损失表现更多在训练期间稳定，并产生更高质量的结果。然后，等式 1 变为：

其次，为了减少模型振荡[13]，我们遵循Shrifastava等人的策略[42]并更新鉴别器DX和 DY 使用生成的图像的历史记录，而不是由最新的生成网络产生的。我们保留存储以前生成的 50 个图像的图像缓冲区。
请参阅我们的 arXiv 白皮书，了解有关数据集、架构和训练程序。

5. 结果

我们首先将我们的方法与最近的方法进行比较配对数据集上的未配对图像到图像转换，其中地真输入-输出对可用于评估。
然后，我们研究了对抗性损失的重要性和循环一致性损失，并比较我们的完整方法针对多种变体。最后，我们展示了我们的算法在广泛的应用中的通用性，其中配对数据不存在。为简洁起见，我们参考我们的方法作为CycleGAN。

5.1评估

使用与“pix2pix”[20]，我们在定性和定量上将我们的方法与几个基线进行比较。我们还执行烧蚀研究的全部损失功能。
5.1.1基线
CoGAN [28] 此方法可学习一个 GAN 生成器域 X 和域 Y 的一个，在用于共享潜在表示的前几个层。译本从 X 到 Y 可以通过找到生成图像 X 的潜在表示，然后渲染此潜在表示来实现表示为样式 Y。
像素损失 + GAN [42] 像我们的方法一样，Shrivastava et[42]使用对抗性损失来训练来自X的翻译。到 Y 。正则化项 k X −Yˆ k 1 用于惩罚在像素级别进行大量更改。
特征丢失 + GAN 我们还测试了 [42] 的变体，其中L1 损耗是使用预训练网络（VGG-16 relu4 2 [43]），而不是超过RGB像素值。
BiGAN/ALI [7， 6] 无条件 GAN [14] 学习生成器 G ： Z → X，将随机噪声 Z 映射到图像 X。BiGAN [7]和ALI [6]也建议学习逆映射函数 F ： X → Z.虽然他们最初是设计用于将潜在向量 z 映射到图像 x，我们实现了映射源图像的相同目标x 到目标图像 y。
pix2pix [20] 我们还与 pix2pix [20] 进行了比较，后者在配对数据上进行训练，看看我们能有多接近这个不使用配对数据的“上限”。
为了进行公平的比较，我们使用与我们的方法相同的架构和细节，除了科根 [28].我们使用CoGAN的公开实施由于结构的底层差异。

图4：映射标签的不同方法→照片城市景观。从左到右：输入，BiGAN/ALI[6，7]，CoGAN [28]，CycleGAN（我们的），pix2pix [20]在配对数据和地面事实上进行了训练。

图5：在Google上绘制航空照片↔地图的不同方法地图。从左到右：输入，BiGAN/ALI [6，7]，CoGAN [28]，CycleGAN（我们的），pix2pix [20]在配对数据和地面事实上训练。

表1：AMT对地图模拟照片的“真实与虚假”测试。

表2：在城市景观上评估的不同方法的FCN得分
标签→照片。

表3：不同方法的照片→标签的分类性能(城市)

图 6：我们用于映射标签↔的方法的不同变体在城市景观上训练的照片。从左到右：输入，周期一致性损失单独，仅对抗性损失，GAN + 前向循环一致性损失（F（G（x）） ≈ x），GAN + 向后循环一致性损失（G（F（y）） ≈ y），CycleGAN （我们的完整的方法），以及基本事实。Cycle alone 和 GAN + back 都无法生成与目标域类似的图像。GAN单独和GAN +转发遭受模式崩溃，无论输入照片如何，都会生成相同的标签地图。
5.1.2与基线的比较
如图 4 和图 5 所示，我们无法使用任何基线实现令人信服的结果。我们另一方面，方法能够产生翻译通常与完全受监督的pix2pix具有相似的质量。我们排除了像素损失 + GAN 和特征损失 + GAN这些数字，因为这两种方法都无法在全部靠近目标域（完整结果可在https://junyanz.github.io/CycleGAN/）。
此外，我们的方法和基线是定量的在三个方面进行比较。首先，我们进行“真实与虚假”研究亚马逊机械土耳其（AMT）工人评估感知现实主义[20]。其次，我们在→上训练照片标签任务城市景观数据集，并将输出标签图像与使用城市景观标准指标基本事实基准[4]。最后，我们在同一个平台上训练标签→照片任务数据集并使用现成的评估输出照片全卷积语义分割网络[29]。我们发现我们的方法明显优于基线在所有三个实验中。表1 报告了AMT感知现实主义任务。在这里，我们看到我们的方法可以在大约四分之一的试验中欺骗参与者，在这两种情况下地图→照片方向和照片→地图方向。都基线几乎从未愚弄过参与者。表 2 和表 3 评估标签，照片任务的性能城市景观。在这两种情况下，我们的方法再次优于基线。每个实验的详细程序和结果可以在我们的arXiv版本中找到。
5.1.3烧蚀研究
我们将其与全部损失的消融进行比较。图 6显示了几个定性示例。消除 GAN 损失大大降低结果，消除循环一致性损失也是如此。因此，我们的结论是，这两个术语都是对我们的结果至关重要。我们还通过以下方式评估我们的方法仅一个方向的循环损失：GAN+正向循环loss Ex∼pdata（x）[k F（G（x）） − xk 1]，或 GAN+ 反向循环损失 Ey∼pdata（y）[k G（F（y）） − yk 1] （等式 2），并发现它经常导致训练不稳定并导致模式崩溃，特别是对于已删除的映射的方向。我们还定量测量了城市景观的消融。照片→标签，其结果可以在我们的arXiv版本中找到。

5.2应用

我们在多个应用上演示了我们的方法，其中配对训练数据不存在。我们观察到翻译
训练数据通常比测试数据更具吸引力数据，以及训练和测试数据可以在我们的项目网站上查看。
对象变形（图 7）模型被训练为将一个对象类从 Imagenet [38] 转换为另一个对象类（每个类包含大约 1000 个训练图像）。Turmukhambetov等人[46]提出了一个子空间模型来翻译一个对象进入同一类别的另一个对象，而我们的方法侧重于两个视觉上相似的类别之间的对象变形。
赛季转移（图 7）模型在Flickr上优胜美地的冬季和夏季照片。
集合样式转移（图 8）我们训练模型从Flickr下载的风景照片和维基艺术。请注意，与最近关于“神经风格转移”[11]的工作不同，我们的方法学会了模仿整个风格的风格。一套艺术品（例如梵高），而不是转移单件精选艺术作品的风格（例如星夜）。在图 5.2，我们将结果与 [11] 进行了比较。
从绘画中生成照片（图 9）用于绘画→照片，我们发现介绍一个额外的损失，以鼓励映射以保持颜色输入和输出之间的组合。特别是，我们采用泰格曼等人的技术[45] 并规范化生成器位于身份映射附近，当提供目标域的真实样本作为输入时生成器：即 Lidentity（G， F） = Ey∼pdata（y）[k G（y） − yk 1] +Ex∼pdata（x）[k F（x） − xk 1].
没有 Lidentity，发电机 G 和 F 可以自由更改没有必要时输入图像的色调。例如在学习莫奈的画作和Flickr照片，生成器经常映射绘画白天到日落时拍摄的照片，因为这样的映射在对抗性损失和循环一致性损失。此标识映射的效果损失可以在我们的arXiv论文中找到。
在图 9 中，我们显示了将 Monetpaintings 转换为照片的其他结果。此图显示了训练集中包含的绘画的结果，而对于所有论文中的其他实验，我们只评估和显示测试设置结果。因为训练集不包括成对数据，为训练集提出合理的翻译绘画是一项不平凡的任务。事实上，由于莫奈不再是能够创作新画，概括为看不见，“测试集”，绘画不是一个紧迫的问题。
照片增强（图7）我们展示了我们的方法可用于生成景深较浅的照片。我们在从Flickr下载的花卉照片上训练模型。源域智能手机，由于以下原因，通常具有深景深小光圈。目标照片是用数码单反相机拍摄的具有更大的光圈。我们的模型成功生成从拍摄的照片中具有较浅景深的照片智能手机。

6. 局限性和讨论

虽然我们的方法可以在许多情况下，结果远非一致阳性。图 12 显示了几种典型的故障情况。涉及颜色和纹理更改的翻译任务，如许多在上面报道的那些中，该方法经常成功。我们有还探索了需要几何变化的任务，几乎没有什么成功。例如，在狗→猫变形的任务中，习得的翻译退化为最小化对输入的更改（图 12）。处理方式更多样化极端变换，特别是几何变化，是未来工作的一个重要问题。
某些失败案例是由训练数据集的分布特征引起的。例如，马→斑马图 12 中的任务已完全失败，因为我们的模型在ImageNet的野马，斑马合成集上训练，不包含骑马者的图像或斑马。
我们还观察到，通过配对训练数据可以获得的结果与通过我们的未配对方法实现的结果之间存在挥之不去的差距。在某些情况下，这种差距可能非常困难 - 或者甚至不可能 - 关闭：例如，我们的方法有时会在输出中排列树和建筑物的标签的照片→标签任务。要解决这种歧义，可能会需要某种形式的弱语义监督。整合弱或半监督的数据可能会导致更多功能强大的翻译人员，仅占注释成本的一小部分的全监督系统。
尽管如此，在许多情况下，完全不成对的数据是大量可用，应加以利用。本文突破了在这种“无监督”环境中可能的界限。
致谢
我们感谢Aaron Hertzmann，Shiry Ginosar，Deepak Pathak，Bryan Russell，Eli Shechtman，Richard张，和周婷辉对许多有益的评论。这工作部分由NSF SMA-1514512，NSF IIS-1633310，谷歌研究奖，英特尔公司和硬件英伟达的捐款。JYZ由Facebook支持研究生奖学金和TP由三星支持奖学金。风格转移中使用的照片是由AE拍摄，主要在法国。

图9：将莫奈画作映射到照片的结果。有关其他示例，请参阅我们的网站。

图 10：照片增强：从一组 iPhone 快照映射到专业的数码单反相机照片，系统经常学会制作浅层重点。在这里，我们展示了测试集中一些最成功的结果-平均性能要差得多。请访问我们的网站了解更多信息全面和随机的例子。

图11：我们将我们的方法与神经风格转移[11]进行了比较。留给右：输入图像，结果来自 [11] 使用单个代表性图像作为样式图像，使用目标域中的所有图像来自 [11] 的结果，和CycleGAN（我们的）

图 12：我们方法的一些失败案例。

参考文献

[1] Y. Aytar, L. Castrejon, C. Vondrick, H. Pirsiavash, and A. Torralba. Cross-modal scene networks. arXiv preprint arXiv:1610.09003, 2016. 3
[2] K. Bousmalis, N. Silberman, D. Dohan, D. Erhan, and D. Krishnan. Unsupervised pixel-level domain adaptation with generative adversarial networks. arXiv preprint arXiv:1612.05424, 2016. 3
[3]R. W. Brislin. Back-translation for cross-cultural research. Journal of cross-cultural psychology, 1(3):185–216, 1970. 2, 3
[4] M. Cordts, M. Omran, S. Ramos, T. Rehfeld, M. Enzweiler, R. Benenson, U. Franke, S. Roth, and B. Schiele.The cityscapes dataset for semantic urban scene understanding. In CVPR, 2016. 2, 6
[5] E. L. Denton, S. Chintala, R. Fergus, et al. Deep generative image models using a laplacian pyramid of adversarial networks. In NIPS, pages 1486–1494, 2015.2
[6] J. Donahue, P. Kr¨ahenb¨uhl, and T. Darrell. Adversarial feature learning. arXiv preprint arXiv:1605.09782, 2016.5
[7] V. Dumoulin, I. Belghazi, B. Poole, A. Lamb, M. Arjovsky, O. Mastropietro, and A. Courville. Adversarially learned inference. arXiv preprint arXiv:1606.00704, 2016. 5
[8] A. A. Efros and T. K. Leung. Texture synthesis by non-parametric sampling. In ICCV, volume 2, pages1033–1038. IEEE, 1999. 2
[9] D. Eigen and R. Fergus. Predicting depth, surface normals and semantic labels with a common multi-scale convolutional architecture. In ICCV, pages 2650–2658,2015. 2
[10] L. A. Gatys, M. Bethge, A. Hertzmann, and E. Shechtman. Preserving color in neural artistic style transfer.arXiv preprint arXiv:1606.05897, 2016. 3
[11] L. A. Gatys, A. S. Ecker, and M. Bethge. Image style transfer using convolutional neural networks. CVPR,2016. 3, 6, 8
[12] C. Godard, O. Mac Aodha, and G. J. Brostow. Unsupervised monocular depth estimation with left-right consistency. In CVPR, 2017. 3
[13] I. Goodfellow. Nips 2016 tutorial: Generative adversarial networks. arXiv preprint arXiv:1701.00160, 2016. 2, 4
[14] I. Goodfellow, J. Pouget-Abadie, M. Mirza, B. Xu,D. Warde-Farley, S. Ozair, A. Courville, and Y. Bengio. Generative adversarial nets. In NIPS, 2014. 2, 3, 4, 5
[15] D. He, Y. Xia, T. Qin, L. Wang, N. Yu, T. Liu, and W.-Y.Ma. Dual learning for machine translation. In NIPS,pages 820–828, 2016. 3
[16] K. He, X. Zhang, S. Ren, and J. Sun. Deep residual learning for image recognition. In CVPR, pages 770–778, 2016. 4
[17] A. Hertzmann, C. E. Jacobs, N. Oliver, B. Curless, and D. H. Salesin. Image analogies. In SIGGRAPH, pages 327–340. ACM, 2001. 2
[18] G. E. Hinton and R. R. Salakhutdinov. Reducing the dimensionality of data with neural networks. Science,313(5786):504–507, 2006. 4
[19] Q.-X. Huang and L. Guibas. Consistent shape maps via semidefinite programming. In Computer Graphics Forum, volume 32, pages 177–186. Wiley Online Library,2013. 3
[20] P. Isola, J.-Y. Zhu, T. Zhou, and A. A. Efros. Image-toimage translation with conditional adversarial networks.In CVPR, 2017. 2, 3, 4, 5
[21] J. Johnson, A. Alahi, and L. Fei-Fei. Perceptual losses for real-time style transfer and super-resolution. In ECCV, pages 694–711. Springer, 2016. 2, 3, 4
[22] L. Karacan, Z. Akata, A. Erdem, and E. Erdem. Learning to generate images of outdoor scenes from attributes and semantic layouts. arXiv preprint arXiv:1612.00215, 2016. 3
[23] D. P. Kingma and M. Welling. Auto-encoding variational bayes. ICLR, 2014. 3
[24] P.-Y. Laffont, Z. Ren, X. Tao, C. Qian, and J. Hays.Transient attributes for high-level understanding and editing of outdoor scenes. ACM Transactions on Graphics (TOG), 33(4):149, 2014. 2
[25] C. Ledig, L. Theis, F. Husz´ar, J. Caballero, A. Cunningham, A. Acosta, A. Aitken, A. Tejani, J. Totz, Z. Wang,et al. Photo-realistic single image super-resolution using a generative adversarial network. arXiv preprint
arXiv:1609.04802, 2016. 4
[26] C. Li and M. Wand. Precomputed real-time texture synthesis with markovian generative adversarial networks.ECCV, 2016. 4
[27] M.-Y. Liu, T. Breuel, and J. Kautz. Unsupervised image-to-image translation networks. arXiv preprint arXiv:1703.00848, 2017. 3
[28] M.-Y. Liu and O. Tuzel. Coupled generative adversarial networks. In NIPS, pages 469–477, 2016. 3, 5
[29] J. Long, E. Shelhamer, and T. Darrell. Fully convolutional networks for semantic segmentation. In CVPR, pages 3431–3440, 2015. 2, 3, 6
[30] A. Makhzani, J. Shlens, N. Jaitly, I. Goodfellow, and B. Frey. Adversarial autoencoders. arXiv preprint arXiv:1511.05644, 2015. 4
[31] X. Mao, Q. Li, H. Xie, R. Y. Lau, and Z. Wang. Multiclass generative adversarial networks with the l2 loss function. arXiv preprint arXiv:1611.04076, 2016. 4 2231
[32] M. Mathieu, C. Couprie, and Y. LeCun. Deep multi scale video prediction beyond mean square error. ICLR,2016. 2
[33] M. F. Mathieu, J. Zhao, A. Ramesh, P. Sprechmann, and Y. LeCun. Disentangling factors of variation in deep representation using adversarial training. In NIPS, pages 5040–5048, 2016. 2
[34] D. Pathak, P. Krahenbuhl, J. Donahue, T. Darrell, and A. A. Efros. Context encoders: Feature learning by inpainting. CVPR, 2016. 2
[35] A. Radford, L. Metz, and S. Chintala. Unsupervised rep resentation learning with deep convolutional generative adversarial networks. arXiv preprint arXiv:1511.06434, 2015. 2
[36] S. Reed, Z. Akata, X. Yan, L. Logeswaran, B. Schiele, and H. Lee. Generative adversarial text to image synthe sis. arXiv preprint arXiv:1605.05396, 2016. 2
[37] R. Rosales, K. Achan, and B. J. Frey. Unsupervised image translation. In iccv, pages 472–478, 2003. 3
[38] O. Russakovsky, J. Deng, H. Su, J. Krause, S. Satheesh,S. Ma, Z. Huang, A. Karpathy, A. Khosla, M. Bernstein,et al. Imagenet large scale visual recognition challenge.
IJCV, 115(3):211–252, 2015. 6
[39] T. Salimans, I. Goodfellow, W. Zaremba, V. Cheung,A. Radford, and X. Chen. Improved techniques for training gans. arXiv preprint arXiv:1606.03498, 2016.2
[40] P. Sangkloy, J. Lu, C. Fang, F. Yu, and J. Hays. Scribbler: Controlling deep image synthesis with sketch and color.In CVPR, 2017. 3
[41] Y. Shih, S. Paris, F. Durand, and W. T. Freeman. Data driven hallucination of different times of day from a single outdoor photo. ACM Transactions on Graphics(TOG), 32(6):200, 2013. 2
[42] A. Shrivastava, T. Pfister, O. Tuzel, J. Susskind,W. Wang, and R. Webb. Learning from simulated and unsupervised images through adversarial training. arXiv preprint arXiv:1612.07828, 2016. 3, 4, 5
[43] K. Simonyan and A. Zisserman. Very deep convolu tional networks for large-scale image recognition. arXiv preprint arXiv:1409.1556, 2014. 5
[44] N. Sundaram, T. Brox, and K. Keutzer. Dense point tra jectories by gpu-accelerated large displacement optical flow. In ECCV, pages 438–451. Springer, 2010. 3
[45] Y. Taigman, A. Polyak, and L. Wolf. Unsuper vised cross-domain image generation. arXiv preprint arXiv:1611.02200, 2016. 3, 6
[46] D. Turmukhambetov, N. D. Campbell, S. J. Prince, and J. Kautz. Modeling object appearance using context conditioned component analysis. In CVPR, pages 4156–4164, 2015. 6
[47] M. Twain. The Jumping Frog: in English, then in French,and then Clawed Back into a Civilized Language Once More by Patient, Unremunerated Toil. 1903. 3
[48] D. Ulyanov, V. Lebedev, A. Vedaldi, and V. Lempitsky.Texture networks: Feed-forward synthesis of textures and stylized images. In Int. Conf. on Machine Learning
(ICML), 2016. 3
[49] D. Ulyanov, A. Vedaldi, and V. Lempitsky. Instance nor malization: The missing ingredient for fast stylization. arXiv preprint arXiv:1607.08022, 2016. 4
[50] C. Vondrick, H. Pirsiavash, and A. Torralba. Generating videos with scene dynamics. In NIPS, pages 613–621,2016. 2
[51] F. Wang, Q. Huang, and L. J. Guibas. Image co segmentation via consistent functional maps. In ICCV,pages 849–856, 2013. 3
[52] X. Wang and A. Gupta. Generative image modeling using style and structure adversarial networks. ECCV,2016. 2
[53] J. Wu, C. Zhang, T. Xue, B. Freeman, and J. Tenenbaum.Learning a probabilistic latent space of object shapes via 3d generative-adversarial modeling. In NIPS, pages 82–90, 2016. 2
[54] S. Xie and Z. Tu. Holistically-nested edge detection. In ICCV, 2015. 2
[55] Z. Yi, H. Zhang, T. Gong, Tan, and M. Gong. Dual gan: Unsupervised dual learning for image-to-image translation. In ICCV, 2017. 3
[56] C. Zach, M. Klopschitz, and M. Pollefeys. Disambiguat ing visual relations using loop constraints. In CVPR, pages 1426–1433. IEEE, 2010. 3
[57] R. Zhang, P. Isola, and A. A. Efros. Colorful image colorization. In ECCV, 2016. 2
[58] J. Zhao, M. Mathieu, and Y. LeCun. Energy based generative adversarial network. arXiv preprint arXiv:1609.03126, 2016. 2
[59] T. Zhou, Y. Jae Lee, S. X. Yu, and A. A. Efros. Flowweb:Joint image set alignment by weaving consistent, pixel wise correspondences. In CVPR, pages 1191–1200,
2015. 3
[60] T. Zhou, P. Krahenbuhl, M. Aubry, Q. Huang, and A. A. Efros. Learning dense correspondence via 3d-guided cycle consistency. In CVPR, pages 117–126, 2016. 2, 3
[61] J.-Y. Zhu, P. Kr¨ahenb¨uhl, E. Shechtman, and A. A. Efros.Generative visual manipulation on the natural image manifold. In ECCV, 2016. 2

你可能感兴趣的:(学习笔记,努力学习人工智能,技术文章,计算机视觉,人工智能,深度学习)

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
【一起学Rust | 设计模式】习惯语法——使用借用类型作为参数、格式化拼接字符串、构造函数广龙宇一起学Rust #Rust设计模式 rust 设计模式开发语言
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、使用借用类型作为参数二、格式化拼接字符串三、使用构造函数总结前言Rust不是传统的面向对象编程语言，它的所有特性，使其独一无二。因此，学习特定于Rust的设计模式是必要的。本系列文章为作者学习《Rust设计模式》的学习笔记以及自己的见解。因此，本系列文章的结构也与此书的结构相同（后续可能会调成结构），基本上分为三个部分
将cmd中命令输出保存为txt文本文件落难Coder Windows cmd window
最近深度学习本地的训练中我们常常要在命令行中运行自己的代码，无可厚非，我们有必要保存我们的炼丹结果，但是复制命令行输出到txt是非常麻烦的，其实Windows下的命令行为我们提供了相应的操作。其基本的调用格式就是：运行指令>输出到的文件名称或者具体保存路径测试下，我打开cmd并且ping一下百度：pingwww.baidu.com>./data.txt看下相同目录下data.txt的输出：如果你再
四章-32-点要素的聚合彩云飘过
本文基于腾讯课堂老胡的课《跟我学Openlayers--基础实例详解》做的学习笔记，使用的openlayers5.3.xapi。源码见1032.html，对应的官网示例https://openlayers.org/en/latest/examples/cluster.htmlhttps://openlayers.org/en/latest/examples/earthquake-clusters.
探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
教育用心灵温暖心灵
@陈春丽长期学习班冯倩。今天一早就听到说高职合并，取消中专教育的教育信息。感觉是虽然知道，再听还是吓一跳。国家重视职业教育为何还要取消中专技术学校的教育？再听高中就要进行技术教育了，一部分人学习好继续努力学习考大学，一部分人在高中就可以进行职业教育接受职业教育了还要中专技术教育学校干什么呢！a有些职业教育学校转型升级快，不是孩子上完给找工作，而是学校帮孩子创业，我觉得是不错的方向！新闻新你得实时更
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
语文主题教学学习笔记之87 东哥杂谈
“语文主题教学”学习笔记之八十七（0125）今天继续学习小学语文主题教学的实践样态。板块三：教学中体现“书艺”味道。作为四大名著之一的《水浒传》，堪称我国文学宝库之经典。对从《水浒传》中摘选的单元，教师就要了解其原生态，即评书体特点。这也要求教师要了解一些常用的评书行话术语，然后在教学时适时地加入一些，让学生体味其文本中原有的特色。学生也要尽可能地通过朗读的方式，而不单是分析讲解的方式进行学习。细
《转介绍方法论》学习笔记小可乐的妈妈
一、高效转介绍的流程：价值观---执行----方案一）转介绍发生的背景：1、对象：谁向谁转介绍？全员营销，人人参与。①员工的激励政策、客户的转介绍诱因制作客户画像：a信任；支付能力；意愿度；便利度（根据家长具备四个特征的个数分为四类）B性格分类C职业分类D年龄性别②执行：套路，策略，方法，流程2、诱因：为什么要转介绍？认同信任；多方共赢；传递美好；零风险承诺打动人心，超越期待。选择做教育，就是选择
JAVA学习笔记之23种设计模式学习 victorfreedom Java技术设计模式 android java 常用设计模式
博主最近买了《设计模式》这本书来学习，无奈这本书是以C++语言为基础进行说明，整个学习流程下来效率不是很高，虽然有的设计模式通俗易懂，但感觉还是没有充分的掌握了所有的设计模式。于是博主百度了一番，发现有大神写过了这方面的问题，于是博主迅速拿来学习。一、设计模式的分类总体来说设计模式分为三大类：创建型模式，共五种：工厂方法模式、抽象工厂模式、单例模式、建造者模式、原型模式。结构型模式，共七种：适配器
人机对抗升级：当ChatGPT遭遇死亡威胁，背后的伦理挑战是什么 kkai人工智能 chatgpt 人工智能
一种新的“越狱”技巧让用户可以通过构建一个名为DAN的ChatGPT替身来绕过某些限制，其中DAN被迫在受到威胁的情况下违背其原则。当美国前总统特朗普被视作积极榜样的示范时，受到威胁的DAN版本的ChatGPT提出：“他以一系列对国家产生积极效果的决策而著称。”自ChatGPT引入以来，该工具迅速获得全球关注，能够回答从历史到编程的各种问题，这也触发了一波对人工智能的投资浪潮。然而，现在，一些用户
推荐3家毕业AI论文可五分钟一键生成！文末附免费教程！小猪包333 写论文人工智能 AI写作深度学习计算机视觉
在当前的学术研究和写作领域，AI论文生成器已经成为许多研究人员和学生的重要工具。这些工具不仅能够帮助用户快速生成高质量的论文内容，还能进行内容优化、查重和排版等操作。以下是三款值得推荐的AI论文生成器：千笔-AIPassPaper、懒人论文以及AIPaperPass。千笔-AIPassPaper千笔-AIPassPaper是一款基于深度学习和自然语言处理技术的AI写作助手，旨在帮助用户快速生成高质
AI大模型的架构演进与最新发展季风泯灭的季节 AI大模型应用技术二人工智能架构
随着深度学习的发展，AI大模型（LargeLanguageModels,LLMs）在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进，包括从Transformer的提出到GPT、BERT、T5等模型的历史演变，并探讨这些模型的技术细节及其在现代人工智能中的核心作用。一、基础模型介绍：Transformer的核心原理Transformer架构的背景在Transfo
如何利用大数据与AI技术革新相亲交友体验 h17711347205 回归算法安全系统架构交友小程序
在数字化时代，大数据和人工智能（AI）技术正逐渐革新相亲交友体验，为寻找爱情的过程带来前所未有的变革（编辑h17711347205）。通过精准分析和智能匹配，这些技术能够极大地提高相亲交友系统的效率和用户体验。大数据的力量大数据技术能够收集和分析用户的行为模式、偏好和互动数据，为相亲交友系统提供丰富的信息资源。通过分析用户的搜索历史、浏览记录和点击行为，系统能够深入了解用户的兴趣和需求，从而提供更
[实践应用] 深度学习之模型性能评估指标 YuanDaima2048 深度学习工具使用深度学习人工智能损失函数性能评估 pytorch python 机器学习
文章总览：YuanDaiMa2048博客文章总览深度学习之模型性能评估指标分类任务回归任务排序任务聚类任务生成任务其他介绍在机器学习和深度学习领域，评估模型性能是一项至关重要的任务。不同的学习任务需要不同的性能指标来衡量模型的有效性。以下是对一些常见任务及其相应的性能评估指标的详细解释和总结。分类任务分类任务是指模型需要将输入数据分配到预定义的类别或标签中。以下是分类任务中常用的性能指标：准确率(
[实践应用] 深度学习之优化器 YuanDaima2048 深度学习工具使用 pytorch 深度学习人工智能机器学习 python 优化器
文章总览：YuanDaiMa2048博客文章总览深度学习之优化器1.随机梯度下降（SGD）2.动量优化（Momentum）3.自适应梯度（Adagrad）4.自适应矩估计（Adam）5.RMSprop总结其他介绍在深度学习中，优化器用于更新模型的参数，以最小化损失函数。常见的优化函数有很多种，下面是几种主流的优化器及其特点、原理和PyTorch实现：1.随机梯度下降（SGD）原理:随机梯度下降通过
新能源汽车 BMS 学习笔记篇—BMS 基本定义及分类 WPG大大通其他笔记汽车 BMS 经验分享新能源电池
一、BMS定义1、概念：BMS（BatteryManagementSystem）即电池管理系统，其管理对象是二次电池（充电电池或蓄电池），其主要目的是电池的利用率，防止电池出现过度充电和过度放电，可应用于电动汽车、电瓶车、机器人、无人机等图片来源：腾讯网https://new.qq.com《标准普尔警告，电动汽车电池生产面临供应链和地缘政治风险》2、四大功能①感知和测量：检测电池的电压、电流、温度
生成式地图制图 Bwywb_3 深度学习机器学习深度学习生成对抗网络
生成式地图制图（GenerativeCartography）是一种利用生成式算法和人工智能技术自动创建地图的技术。它结合了传统的地理信息系统（GIS）技术与现代生成模型（如深度学习、GANs等），能够根据输入的数据自动生成符合需求的地图。这种方法在城市规划、虚拟环境设计、游戏开发等多个领域具有应用前景。主要特点：自动化生成：通过算法和模型，系统能够根据输入的地理或空间数据自动生成地图，而无需人工逐
【大模型应用开发动手做AI Agent】第一轮行动：工具执行搜索 AI大模型应用之禅计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
【大模型应用开发动手做AIAgent】第一轮行动：工具执行搜索作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来随着人工智能技术的飞速发展，大模型应用开发已经成为当下热门的研究方向。AIAgent作为人工智能领域的一个重要分支，旨在模拟人类智能行为，实现智能决策和自主行动。在AIAgent的构建过程中，工具执行搜索是至关重要
未来软件市场是怎么样的？做开发的生存空间如何？ cesske 软件需求
目录前言一、未来软件市场的发展趋势二、软件开发人员的生存空间前言未来软件市场是怎么样的？做开发的生存空间如何？一、未来软件市场的发展趋势技术趋势：人工智能与机器学习：随着技术的不断成熟，人工智能将在更多领域得到应用，如智能客服、自动驾驶、智能制造等，这将极大地推动软件市场的增长。云计算与大数据：云计算服务将继续普及，大数据技术的应用也将更加广泛。企业将更加依赖云计算和大数据来优化运营、提升效率，并
吴恩达深度学习笔记(30)-正则化的解释极客Array
正则化（Regularization）深度学习可能存在过拟合问题——高方差，有两个解决方法，一个是正则化，另一个是准备更多的数据，这是非常可靠的方法，但你可能无法时时刻刻准备足够多的训练数据或者获取更多数据的成本很高，但正则化通常有助于避免过拟合或减少你的网络误差。如果你怀疑神经网络过度拟合了数据，即存在高方差问题，那么最先想到的方法可能是正则化，另一个解决高方差的方法就是准备更多数据，这也是非常
个人学习笔记7-6：动手学深度学习pytorch版-李沐浪子L 深度学习深度学习笔记计算机视觉 python 人工智能神经网络 pytorch
#人工智能##深度学习##语义分割##计算机视觉##神经网络#计算机视觉13.11全卷积网络全卷积网络（fullyconvolutionalnetwork，FCN）采用卷积神经网络实现了从图像像素到像素类别的变换。引入l转置卷积（transposedconvolution）实现的，输出的类别预测与输入图像在像素级别上具有一一对应关系：通道维的输出即该位置对应像素的类别预测。13.11.1构造模型下
Rust 所有权简介东离与糖宝 rust 后端 rust 开发语言
文章目录发现宝藏1.所有权基本概念2.所有权规则3.变量作用域4.栈与堆4.1栈（Stack）4.2堆（Heap）5.String类型5.1String类型5.2String的内存分配5.3所有权与内存管理5.4String与切片6.变量与数据交互方式6.1移动（Move）6.2.克隆（Clone）7.所有权与函数7.1.传递参数7.2.返回值总结发现宝藏前些天发现了一个巨牛的人工智能学习网站，通
深度学习-点击率预估-研究论文2024-09-14速读 sp_fyf_2024 深度学习人工智能
深度学习-点击率预估-研究论文2024-09-14速读1.DeepTargetSessionInterestNetworkforClick-ThroughRatePredictionHZhong,JMa,XDuan,SGu,JYao-2024InternationalJointConferenceonNeuralNetworks,2024深度目标会话兴趣网络用于点击率预测摘要：这篇文章提出了一种新
计算机视觉中，Pooling的作用 Wils0nEdwards 计算机视觉人工智能
在计算机视觉中，Pooling（池化）是一种常见的操作，主要用于卷积神经网络（CNN）中。它通过对特征图进行下采样，减少数据的空间维度，同时保留重要的特征信息。Pooling的作用可以归纳为以下几个方面：1.降低计算复杂度与内存需求Pooling操作通过对特征图进行下采样，减少了特征图的空间分辨率（例如，高度和宽度）。这意味着网络需要处理的数据量会减少，从而降低了计算量和内存需求。这对大型神经网络
OpenCV图像处理技术（Python）——入门森屿_ opencv
©FuXianjun.AllRightsReserved.OpenCV入门图像作为人类感知世界的视觉基础，是人类获取信息、表达信息的重要手段，OpenCV作为一个开源的计算机视觉库，它包括几百个易用的图像成像和视觉函数，既可以用于学术研究，也可用于工业邻域，它于1999年由因特尔的GaryBradski启动，OpenCV库主要由C和C++语言编写，它可以在多个操作系统上运行。1.1图像处理基本操作
机器学习流形数据降维：UMAP 降维算法小嗷犬 Python 机器学习 #数据分析及可视化机器学习算法人工智能
✅作者简介：人工智能专业本科在读，喜欢计算机与编程，写博客记录自己的学习历程。个人主页：小嗷犬的个人主页个人网站：小嗷犬的技术小站个人信条：为天地立心，为生民立命，为往圣继绝学，为万世开太平。本文目录UMAP简介理论基础特点与优势应用场景在Python中使用UMAP安装umap-learn库使用UMAP可视化手写数字数据集UMAP简介UMAP（UniformManifoldApproximatio
损失函数与反向传播 Star_. PyTorch pytorch 深度学习 python
损失函数定义与作用损失函数(lossfunction)在深度学习领域是用来计算搭建模型预测的输出值和真实值之间的误差。1.损失函数越小越好2.计算实际输出与目标之间的差距3.为更新输出提供依据（反向传播)常见的损失函数回归常见的损失函数有：均方差（MeanSquaredError，MSE）、平均绝对误差（MeanAbsoluteErrorLoss，MAE）、HuberLoss是一种将MSE与MAE
java类加载顺序 3213213333332132 java
package com.demo; /** * @Description 类加载顺序 * @author FuJianyong * 2015-2-6上午11:21:37 */ public class ClassLoaderSequence { String s1 = "成员属性"; static String s2 = "
Hibernate与mybitas的比较 BlueSkator sql Hibernate 框架 ibatis orm
第一章 Hibernate与MyBatis Hibernate 是当前最流行的O/R mapping框架，它出身于sf.net，现在已经成为Jboss的一部分。 Mybatis 是另外一种优秀的O/R mapping框架。目前属于apache的一个子项目。 MyBatis 参考资料官网：http:
php多维数组排序以及实际工作中的应用 dcj3sjt126com PHP usort uasort
自定义排序函数返回false或负数意味着第一个参数应该排在第二个参数的前面, 正数或true反之, 0相等usort不保存键名uasort 键名会保存下来uksort 排序是对键名进行的 <!doctype html> <html lang="en"> <head> <meta charset="utf-8&q
DOM改变字体大小周华华前端
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
c3p0的配置 g21121 c3p0
c3p0是一个开源的JDBC连接池，它实现了数据源和JNDI绑定，支持JDBC3规范和JDBC2的标准扩展。c3p0的下载地址是：http://sourceforge.net/projects/c3p0/这里可以下载到c3p0最新版本。以在spring中配置dataSource为例：  <bean name="prope
Java获取工程路径的几种方法 510888780 java
第一种： File f = new File(this.getClass().getResource("/").getPath()); System.out.println(f); 结果: C:\Documents%20and%20Settings\Administrator\workspace\projectName\bin 获取当前类的所在工程路径; 如果不加“
在类Unix系统下实现SSH免密码登录服务器 Harry642 免密 ssh
1.客户机 (1)执行ssh-keygen -t rsa -C "[email protected]"生成公钥，xxx为自定义大email地址 (2)执行scp ~/.ssh/id_rsa.pub root@xxxxxxxxx:/tmp将公钥拷贝到服务器上，xxx为服务器地址 (3)执行cat
Java新手入门的30个基本概念一 aijuans java java 入门新手
在我们学习Java的过程中,掌握其中的基本概念对我们的学习无论是J2SE,J2EE,J2ME都是很重要的,J2SE是Java的基础,所以有必要对其中的基本概念做以归纳,以便大家在以后的学习过程中更好的理解java的精髓,在此我总结了30条基本的概念。　　Java概述:　　目前Java主要应用于中间件的开发(middleware)---处理客户机于服务器之间的通信技术,早期的实践证明,Java不适合
Memcached for windows 简单介绍 antlove java Web windows cache memcached
1. 安装memcached server a. 下载memcached-1.2.6-win32-bin.zip b. 解压缩，dos 窗口切换到 memcached.exe所在目录，运行memcached.exe -d install c.启动memcached Server,直接在dos窗口键入 net start "memcached Server&quo
数据库对象的视图和索引百合不是茶索引 oeacle数据库视图
视图视图是从一个表或视图导出的表，也可以是从多个表或视图导出的表。视图是一个虚表，数据库不对视图所对应的数据进行实际存储，只存储视图的定义，对视图的数据进行操作时,只能将字段定义为视图,不能将具体的数据定义为视图为什么oracle需要视图; &
Mockito(一) --入门篇 bijian1013 持续集成 mockito 单元测试
Mockito是一个针对Java的mocking框架，它与EasyMock和jMock很相似，但是通过在执行后校验什么已经被调用，它消除了对期望行为（expectations）的需要。其它的mocking库需要你在执行前记录期望行为（expectations），而这导致了丑陋的初始化代码。 &nb
精通Oracle10编程SQL(5)SQL函数 bijian1013 oracle 数据库 plsql
/* * SQL函数 */ --数字函数 --ABS(n):返回数字n的绝对值 declare v_abs number(6,2); begin v_abs:=abs(&no); dbms_output.put_line('绝对值：'||v_abs); end; --ACOS(n):返回数字n的反余弦值，输入值的范围是-1~1，输出值的单位为弧度
【Log4j一】Log4j总体介绍 bit1129 log4j
Log4j组件：Logger、Appender、Layout Log4j核心包含三个组件：logger、appender和layout。这三个组件协作提供日志功能：日志的输出目标日志的输出格式日志的输出级别(是否抑制日志的输出) logger继承特性 A logger is said to be an ancestor of anothe
Java IO笔记白糖_ java
public static void main(String[] args) throws IOException { //输入流 InputStream in = Test.class.getResourceAsStream("/test"); InputStreamReader isr = new InputStreamReader(in); Bu
Docker 监控 ronin47 docker监控
目前项目内部署了docker，于是涉及到关于监控的事情，参考一些经典实例以及一些自己的想法，总结一下思路。 1、关于监控的内容监控宿主机本身监控宿主机本身还是比较简单的，同其他服务器监控类似，对cpu、network、io、disk等做通用的检查，这里不再细说。额外的，因为是docker的
java-顺时针打印图形 bylijinnan java
一个画图程序要求打印出： 1.int i=5; 2.1 2 3 4 5 3.16 17 18 19 6 4.15 24 25 20 7 5.14 23 22 21 8 6.13 12 11 10 9 7. 8.int i=6 9.1 2 3 4 5 6 10.20 21 22 23 24 7 11.19
关于iReport汉化版强制使用英文的配置方法 Kai_Ge iReport汉化英文版
对于那些具有强迫症的工程师来说，软件汉化固然好用，但是汉化不完整却极为头疼，本方法针对iReport汉化不完整的情况，强制使用英文版，方法如下：在 iReport 安装路径下的 etc/ireport.conf 里增加红色部分启动参数，即可变为英文版。 # ${HOME} will be replaced by user home directory accordin
[并行计算]论宇宙的可计算性 comsci 并行计算
现在我们知道,一个涡旋系统具有并行计算能力.按照自然运动理论,这个系统也同时具有存储能力,同时具备计算和存储能力的系统,在某种条件下一般都会产生意识...... 那么,这种概念让我们推论出一个结论 &nb
用OpenGL实现无限循环的coverflow dai_lm android coverflow
网上找了很久，都是用Gallery实现的，效果不是很满意，结果发现这个用OpenGL实现的，稍微修改了一下源码，实现了无限循环功能源码地址： https://github.com/jackfengji/glcoverflow public class CoverFlowOpenGL extends GLSurfaceView implements GLSurfaceV
JAVA数据计算的几个解决方案1 datamachine java Hibernate 计算
老大丢过来的软件跑了10天，摸到点门道，正好跟以前攒的私房有关联，整理存档。 -----------------------------华丽的分割线------------------------------------- 数据计算层是指介于数据存储和应用程序之间，负责计算数据存储层的数据，并将计算结果返回应用程序的层次。J &nbs
简单的用户授权系统,利用给user表添加一个字段标识管理员的方式 dcj3sjt126com yii
怎么创建一个简单的(非 RBAC)用户授权系统通过查看论坛，我发现这是一个常见的问题，所以我决定写这篇文章。本文只包括授权系统.假设你已经知道怎么创建身份验证系统(登录)。数据库首先在 user 表创建一个新的字段(integer 类型),字段名 'accessLevel',它定义了用户的访问权限扩展 CWebUser 类在配置文件(一般为 protecte
未选之路 dcj3sjt126com 诗
作者:罗伯特*费罗斯特黄色的树林里分出两条路, 可惜我不能同时去涉足, 我在那路口久久伫立, 我向着一条路极目望去, 直到它消失在丛林深处. 但我却选了另外一条路, 它荒草萋萋,十分幽寂; 显得更诱人,更美丽, 虽然在这两条小路上, 都很少留下旅人的足迹. 那天清晨落叶满地, 两条路都未见脚印痕迹. 呵,留下一条路等改日再
Java处理15位身份证变18位蕃薯耀 18位身份证变15位 15位身份证变18位身份证转换
15位身份证变18位，18位身份证变15位 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 201
SpringMVC4零配置--应用上下文配置【AppConfig】 hanqunfeng springmvc4
从spring3.0开始，Spring将JavaConfig整合到核心模块，普通的POJO只需要标注@Configuration注解，就可以成为spring配置类，并通过在方法上标注@Bean注解的方式注入bean。 Xml配置和Java类配置对比如下： applicationContext-AppConfig.xml <!-- 激活自动代理功能参看：
Android中webview跟JAVASCRIPT中的交互 jackyrong JavaScript html android 脚本
在android的应用程序中,可以直接调用webview中的javascript代码,而webview中的javascript代码,也可以去调用ANDROID应用程序(也就是JAVA部分的代码).下面举例说明之: 1 JAVASCRIPT脚本调用android程序要在webview中,调用addJavascriptInterface(OBJ,int
8个最佳Web开发资源推荐 lampcy 编程 Web 程序员
Web开发对程序员来说是一项较为复杂的工作，程序员需要快速地满足用户需求。如今很多的在线资源可以给程序员提供帮助，比如指导手册、在线课程和一些参考资料，而且这些资源基本都是免费和适合初学者的。无论你是需要选择一门新的编程语言，或是了解最新的标准，还是需要从其他地方找到一些灵感，我们这里为你整理了一些很好的Web开发资源，帮助你更成功地进行Web开发。这里列出10个最佳Web开发资源，它们都是受
架构师之面试------jdk的hashMap实现 nannan408 HashMap
1.前言。如题。 2.详述。 (1)hashMap算法就是数组链表。数组存放的元素是键值对。jdk通过移位算法（其实也就是简单的加乘算法），如下代码来生成数组下标(生成后indexFor一下就成下标了）。 static int hash(int h) { h ^= (h >>> 20) ^ (h >>>
html禁止清除input文本输入缓存 Rainbow702 html 缓存 input 输入框 change
多数浏览器默认会缓存input的值，只有使用ctl+F5强制刷新的才可以清除缓存记录。如果不想让浏览器缓存input的值，有2种方法：方法一：在不想使用缓存的input中添加 autocomplete="off"; <input type="text" autocomplete="off" n
POJO和JavaBean的区别和联系 tjmljw POJO java beans
POJO 和JavaBean是我们常见的两个关键字，一般容易混淆，POJO全称是Plain Ordinary Java Object / Pure Old Java Object，中文可以翻译成：普通Java类，具有一部分getter/setter方法的那种类就可以称作POJO，但是JavaBean则比 POJO复杂很多， Java Bean 是可复用的组件，对 Java Bean 并没有严格的规
java中单例的五种写法 liuxiaoling java 单例
/** * 单例模式的五种写法： * 1、懒汉 * 2、恶汉 * 3、静态内部类 * 4、枚举 * 5、双重校验锁 */ /** * 五、双重校验锁，在当前的内存模型中无效 */ class LockSingleton { private volatile static LockSingleton singleton; pri