StarkerRegen

【论文翻译】Auto-painter：基于条件Wasserstein生成性对抗网络的草图卡通形象生成

Auto-painter: Cartoon image generation from sketch by using conditional Wasserstein generative adversarial networks

摘要
引言
相关工作

生成对抗网络
基于草图的图像合成

Auto-painter

网络架构
条件式WGANs
传统的损失

基于草图的卡通图像生成

数据集
评价指标
结果和讨论

交互式着色
结论

摘要

近年，基于深度神经网络的真实感图像生成已成为机器学习和计算机视觉领域的研究热点。通过从大量的图像集合中学习，可以在像素级生成图像。学习由黑白草图生成彩色卡通图像不仅是有趣的研究问题，也是数字娱乐领域一种有效的应用。本文研究了利用条件生成对抗网络(CGAN)实现草图到图像合成的问题，提出了一种名为auto-painter的自动草图着色模型。为了克服模型崩溃并提升模型融合效果，Wasserstein距离被用于训练cGAN。新的模型不仅能够用适当的颜色填涂手绘草稿，而且还允许用户添加色彩提示指导着色过程。不同草图数据集的实验结果表明，与其他现有的图像翻译算法相比，auto-painter的性能更好。

引言

人类具有强大的理解黑白卡通草图的能力。我们的大脑可以由抽象的黑白动画片创建逼真的彩色图像。然而，选择合适的颜色并适当更改光线和阴影以创建与视觉兼容的卡通形象可能需要出色的艺术天分，这对未经训练的人们来说并不容易。如果我们可以自动给草稿上色，它将会成为一个很好的应用以辅助卡通或其他数字娱乐行业的艺术家。在此工作中，我们致力于利用深度神经网络将黑白线稿转换成特定的卡通风格来解决上述问题。事实上，新模型可以修饰原始的人类艺术天分，甚至激发艺术家创造不同风格的卡通。理想情况下，人们可以根据自己的口味自由地生成各种风格的卡通。
由草图生成卡通图像可以被视为一个图像合成问题。从前，许多将草图和已存在的图像碎片数据库匹配的非参数模型^[1,2,3]被提出。最近，基于深度神经网络的大量图像合成方法^[4,5,6,7]应运而生。这些方法可以生成有细节的图像，例如人脸、卧室、椅子和手写数字。由于逼真的图像充满清晰的细节，生成结果可能会受到模糊^[8]、噪声^[6]和对象抖动^[9]的影响。此外，由于生成器从随机的低维向量中采样且模型具有很大的灵活性，网络的输出很难被控制。几种新方法探讨了不同应用中可控制的图像合成方法的适用性，例如超分辨率问题^{[10,11,12,13]}、语义对象标记^[14]、图像处理^[15]、图像去雾^[16]、灰度图像着色^[17]和其他图像到图像转换^[18,19]，得到了令人信服的结果。对于控制信号相对稀疏、比基于灰度着色更不适定的草图到图像转换问题^[20]而言，尤其需要一个模型来合成比输入所含内容更丰富的图像细节。网络应学习低级纹理信息和高级图像风格。色彩搭配可以反映出卡通风格（例如，一种风格可能是绿色头发、紫色眼睛，另一种风格可能是黑色头发、黑色眼睛），这可能需要更多的约束来建模。我们研究如何使用具有条件设定的生成对抗网络（GANs）进行图像生成。约束包括总方差损失、像素损失和特征损失，被用于训练生成器以便生成更多不同样式的颜色搭配。TV正则化首次被使用^[21]以鼓励空间平滑。我们还引入了颜色控制，使用户可以用他们喜欢的颜色填涂。图1-1展示了一个从草图生成卡通图像的例子，并将auto-painter的结果（有无颜色控制）与中间的真实图像进行比较。
此项工作的主要贡献如下：

我们提出了一个名为auto-painter的学习模型，可以利用条件生成网络（cGAN）由草图自动生成生动、高品质的彩色卡通图像。在模型中，我们将传统损失和对抗损失组合以生成更合适的颜色。
Wasserstein距离损失被用在基于cGAN的模型中。实验结果表明Wasserstein GANs^[22]可以稳定地训练cGANs并获得与其他模型相比更好的结果。
我们的成果是最早使用GANs进行卡通生成的任务之一，其初始结果被线上发表在arXiv。我们还设计了一个有用户界面的示例程序以供测试，所有代码都已开源。

Auto-painter

Auto-painter是一个基于条件生成对抗网络的有监督学习模型，输入一个黑白草图，模型可以根据训练数据给定的草图-图像对生成着色图像。我们以前馈深度神经网络作为生成器在测试中得到快速响应。生成器以草图作为输入，并在像素级输出相同分辨率的彩色卡通图像。

网络架构

之前的许多解决方案^[11,20,31]使用纯净的encoder-decoder网络。输入通过一系列下采样步骤变为较低维度，然后通过全连接层进行一些非线性转换，最后通过上采样得到当前输出尺寸。这种前馈结构可能在通过层时导致信息丢失。特别是在草图到图像转换问题上，我们需要保证输入的轮廓是最重要的信息以确保输出图像的质量。我们使用U-net^[29]而不是encoder-decoder结构，并将编码器中的层连接到相应的解码器层。如图3-1所示，为了对草图的低级信息进行解码，我们将解码器 A 连接到解码层 A’ 以生成最终的彩色卡通图像，其中 A 包含草图的低级信息而 A’ 主要包含经过训练的颜色绘画信息。

图3-1 生成器的U-net结构：黄色块代表编码层，蓝色块代表解码层。在每个解码层中，对应的编码层连接到当前层以解码下一层。例如，B 和 B’ 级联在一起通过反卷积得到A’ 。

判别器相比生成器而言仅含编码器单元，目的是区分输入的草图-图像对是“真”还是“假”。网络被训练成可以最大化分类准确性的程度。如图3-2所示，判别器的输出是一个概率矩阵，其中每个元素给出了使用马尔可夫随机场或PatchGAN^[18]采样得到的一对色块是真实的可能性。输入和输出之间的卷积层提取了输入对的高级特征。

图3-2 PatchGAN判别器：判别器的输入是草图对（黄色块）和实际目标图像（红色块），或者草图与生成的图像对（蓝色块）。

条件式WGANs

与无监督的GAN模型不同，cGANs^[23]学习观察到的约束和随机噪声向量到真实图像的映射。通用的cGANs的目标（损失）函数可以表示为式 3-1:

其中生成器 G 最大程度地降低目标函数而判别器 D 最大程度地提升它。我们通过减小两个分布间的Jensen-Shannon(JS)散度来优化 G 的参数，使得生成数据 P_g 的分布和实际数据 P_r 的分布相近，并在cGANs应用Wasserstein损失^[22]。当两个分布具有不相交或位于低维流形的支撑集时，cGANs原始的JS散度不连续，使得模型很难训练，甚至导致模型崩溃^[22]。Arjovsky等^[22]在进行损耗度量时采用了地球移动距离（EM），因为它可以反映两个分布间的距离，甚至是在它们不相交的情况下。EM距离的定义如式3-2。

其中 f 是 1-Lipschitz， p_r 是真实数据的分布而 p_g 是生成数据的分布。它表示“质量”必须移动以将分布 p_g 转变为分布 p_r 。将等式3-2应用于GAN，我们可以得到cGAN中的EM距离如式3-3。

传统的损失

基于草图的卡通图像生成

数据集

为了训练auto-painter模型，我们用爬虫从网上搜集了大量的卡通图片。大部分之前的研究^[17,20]学习低分辨率图像。由于现实世界中大多数动画具有较高的分辨率，训练图像的分辨率都为512x512。为了不改变卡通图片的原始比例，我们先随机缩放使得最短的边长于512像素，然后沿较长边从底部、中间和顶部裁剪图片。通过此设置，我们可以得到原始图片的不同部分并保持比例。尽管这增加了训练模型的难度，但我们可以加深神经网络并使用更多的约束来稳定训练。由于在有监督训练中很难找到匹配的草图-卡通图像对，我们需要从卡通图片中提取轮廓作为训练集。以前，研究人员着重于生成图片轮廓^[36,37,38]以实现基于草图的图像检索。我们采用扩展的different-of-Gaussians算子（XDoG^[38]）从彩色卡通图像中提取轮廓。XDoG算子有一些连续的参数空间。通过调整XDoG的参数 γ，我们可以获得草图中不同等级的细节（如图4-1）。在我们的研究中，为了获得更好的生成结果，我们将四种草图都包含在训练中。

图4-1 XDoG滤波生成的黑白草图。为了获得不同级别的高频信息，从左到右的参数 γ 分别是0.96，0.97,0.98，0.99。

经过预处理（调整大小、裁剪成方形图片和提取轮廓）后，我们得到了Minions和RandCartoon两个卡通数据集。Minions包含1100张不同的彩色子集，只有一些固定的颜色类型。我们用它来讨论传统损失（L_tv 和 L_f）中每个元素的有效性以研究模型捕获细节的能力。RandCartoon包含13518张随机类型的卡通图片，包括具有简单背景的人物和一些具有复杂背景的图像，有着丰富的色彩信息。我们使用这个数据集来评估模型的生成效果并创建色彩控制下的交互式模型。在每次试验中，我们使用90%的数据作为训练集，并将10%的数据作为测试集。

评价指标

众所周知，评估生成图像的质量是一个开放且困难的问题^[17]。类似于像素均方误差这样传统的指标无法获得输出图像的高级特征。为了评估auto-painter的视觉质量并比较现有模型（例如pix2pix^[18]模型），我们受为了评估真实感图像生成模型的“真实vs伪劣”测试^[17,18]启发，设计了一个名为“喜欢vs不喜欢”的测试。因为auto-painter的最终目标是创造视觉生动的卡通图像，测试人员被提供不同算法生成的着色图像并要求他们选出最好的和最差的图片。此研究中，我们设计这个评估指标主要是为了分析损失函数中不同元素造成的影响。不同于该文章^[17]，我们在两秒钟内同时发布四张图片并完成对四个算法的评估，而不是逐一进行评估。这使得参与者可以在更全面的比较下得出结论。

结果和讨论

Auto-painter模型的损失函数有四个子项，分别是3.2节介绍的低级像素损失 L_p和 L_tv ，高级语义损失 L_f 和风格损失 L_G 。像素损失是图像翻译任务中最常见的约束，pix2pix^[18]、scribbler^[20]和OutlineGAN^[30]都运用了像素级损失。我们将在所有训练参数相同（包括随机种子、学习率、期和批大小）情况下设计一个比较研究，唯一不同的是目标函数。没有特征损失及总变分（tv）损失并由cGAN训练得到的pix2pix^[18]模型被用来与auto-painter进行比较。我们还设计了一个没有 L_G 的基础模型来研究cWGAN的影响。
由图4-4可知，与没有 L_G 的基础模型相比较，我们可以看出使用cWGAN的 auto-painter 获得了更生动的生成结果。没有cWGAN时，网络趋向于将结果图像的每一个像素预测为数据集的平均像素值以减小传统损失。通过进行对抗训练，pix2pix和auto-painter模型都能产生有意义的结果，但是pix2pix模型有时会产生不合理结果（第一个女孩的鼻子，第二个女孩的眼睛和第三个女孩的眼镜）。我们可以看到，添加 L_tv 和 L_f 可以产生更合理的有丰富细节的结果，例如女孩的眼睛和头发。

图4-4 RandCartoon数据集样本下基础模型、pix2pix和auto-painter的比较结果

不仅如此，cWGAN损失可以帮助cGAN更快更好地建模。我们可以直观地看到图4-5中训练过程的差异。为了校验3.2节介绍的约束（ L_f 和 L_tv ）的重要性，我们进行消融实验以独立每个损失项的影响。图4-6提供了这些变化在Minions上的定性结果。没有tv损失（w_tv = 0）时，结果图像趋向溶于背景并看起来杂乱。如果令 w_f = 0（意味着我们不考虑特征损失），图像细节会变得模糊。同时考虑两者可能会产生质量结果。根据式4-1和4-2，我们设置 i ∈ [1,40], j ∈ [1,4], c = 1 来评估每个损失项，这意味着我们使用40张图片来评估不同的目标函数。

图4-5 cGAN和cWGAN训练过程中loss的变化趋势图

图4-6 不同参数设置下auto-painter和pix2pix的结果

图4-2展示了pix2pix^[18]模型、pix2pix+tv损失、pix2pix+特征损失和auto-painter的比较结果。由该图可知，auto-painter是受试者最喜欢的算法而pix2pix是最差的。添加tv损失会提高人气，但随着方差增大，稳定性会降低。然而，将tv损失和特征损失结合在一起会得到最大的流行度和最小的方差。总之，auto-painter考虑了所有这些约束以适合所有种类的草图（有无背景、手绘或经过装饰）并且可以实现最好的性能。
不仅如此，我们利用RandCartoon数据集设置了大型用户数据库，其中 i ∈ [1,1000], j ∈ [1,2], c = 1 。图4-3的结果显示auto-painter具有更好的性能。
某些参数依照数据集有不同的最佳设置。在我们的实验中，我们发现一些参数具有不同的最佳设置。在我们的实验中，我们发现，如果不同的损失项的梯度值彼此相同，则该模型可以平衡每个损失项的影响并产生令人满意的结果。在此基础上，图4-7展示了试验中的最优参数设置。Pix2pix和auto-painter在Minions(m)和RandCartoon©上分别有两组参数。
用户还可以确定一些其他参数，例如式3-7中的。通过实验可以看出VGG16第2至4层有强健的提取特征的能力。 j ∈ [2,4] 的结果如图4-8所示。图4-7中特征损失的权重由 j = 4 获得。

图4-7 图4-4和4-6所示比较实验的参数设置

图4-8 使用VGG16中不同层的结果来评估特征损失

交互式着色

给定一个512x512像素的输入图像，auto-painter可以在1秒内生成着色结果图像，使得设计即时反馈的交互式图像编辑工具成为可能。我们提供了两种方法以供用户与auto-painter进行交互。
（1）草图修改：在Minions数据集上经过训练的auto-painter为用户提供了设计“minions风格”视觉图像的工具。如图5-1左侧所示，用户可以在给定的初始草图基础上修改草稿，例如更改眼镜、手势等。有趣的是尽管输入为简单的手绘草图，auto-painter也可以生成“minions风格”的卡通图像（如图5-1右侧所示）

图5-1 由修改过的和业余手绘草图生成的卡通图像

（2）色彩控制下的草图合成：当一张灰度草图被转换为真实照片时，由于显示了真实世界的色彩，其配色方案相对固定。例如，草是绿色的，天是蓝色的，沙子是金色的。复杂的训练集中可能会出现大量可供选择的配色方案。特别是在卡通图像数据集中，女孩的眼睛可能是绿色或紫色，这在现实世界中是罕见的。以minions为例，模型可以学习minion形状和黄色之间的相关性，但很难通过类似于RandCartoon的数据集学到同样的关联。当观察复杂的卡通草图时，不同的用户可能会喜欢不同的配色主题，但是经黑白草图训练过的生成器只能选择特定的配色方案。所以我们训练了一个色彩控制模型以满足不同用户的审美需求。为了训练auto-painter识别颜色控制信号，我们在给定的草图上添加色块。我们使用经过高斯滤波的真实图像，然后在起始位置随机采样随机数目的点并沿对角线生成色块。显然每个特定的色块都不应与不同的颜色区域相交，所以我们在增长块时设置了一个约束：当前色块的平均颜色和下个采样块的差值超过阈值时应停止增长。阈值可以控制色块的大小。可以肯定的是，如果训练集和测试集保持一致，则模型将得到最佳结果。由于无法控制用户的输入，我们对不同的色块大小进行交叉测试。我们通过给RandCartoon数据集添加颜色控制色块生成小、中、大（表示色块大小）三种训练集。由图5-2可知，中等尺寸的性能一般表现最佳。

图5-2 RandCartoon的结果。训练时阈值分别设为10,30，50（从第二行到第四行）。第一行是分别从不同训练集中随机采样得到的输入草图。红色方框指出了对应的训练和测试草图。毫无疑问，带有红色框的结果具有最佳性能。如果训练图片的色块较大而测试草图的色块较小，则将出现一些空白区域。另一方面，如果测试草图的色块大于训练草图，该色块会被凝固。总之，我们建议使用该范围内的阈值^[25,35]。

图5-3展示了基于合成色彩控制块重构RandCartoon的结果。我们可以看到，对于复杂任务，auto-painter可以成功地识别图像边缘并产生可行的配色方案。色彩控制块会在特定的区域内被自然地呈现出来。同时，我们还使用用户输入和完全背离于真实数据的色彩进行测试（如图5-4）。尽管如此，auto-painter仍能够在对象边缘内上色并区分草图的不同部分。

我们也用OutlineGAN^[30]进行对照，结果如图5-5。我们可以看到本模型能够在干净的背景下生成更生动的颜色。OutlineGAN需要更多的颜色笔触而我们只需要少量的色块，并且auto-painter的结果色彩更鲜明。尽管OutlineGAN也可以给出与控制信号一致的结果，但是它存在浅色的模糊。为了避免不公平的比较，我们从其主页选择了测试图片（第三行），并从互联网上搜集了其他测试图片。

图5-5 Auto-painter和OutlineGAN的比较结果图

结论

本文提出了auto-painter模型以解决草图到图像转换的问题。我们的方法基于带有Wasserstein距离的条件生成对抗网络。U-net结构被用于使输出图像同时具有低级草图信息和高级颜色信息。我们基于pix2pix模型设置了更多的约束以获得更好的绘画性能，并对auto-painter进行训练以适应色彩控制，从而使网络能够合成符合不同用户审美的结果。经验结果表明，auto-painter可以在两个给定的数据集上生成高质量的卡通图像，并且是志愿者主观测试下的最佳方法。尽管结果令人鼓舞，但我们当前的系统仍像其他学习模型一样在调整参数方面遇到了困难。复杂的网络结构可能会导致训练速度降低。例如，给定的数据集为RandCartoon时，它在单个Tesla K80 GPU上进行2到3天的训练才能得到相当好的结果。在今后的工作中，我们将致力于使用更高质量、更大型的数据集来改善系统性能，然后通过使用小型CNN过滤器^[39]来压缩模型尺寸并提高速度以便于构建用户交互式工具。

论文链接：https://www.sciencedirect.com/science/article/abs/pii/S0925231218306209

C++11堆操作深度解析：std::is_heap与std::is_heap_until原理解析与实践
文章目录堆结构基础与函数接口堆的核心性质函数签名与核心接口std::is_heapstd::is_heap_until实现原理深度剖析std::is_heap的验证逻辑std::is_heap_until的定位策略算法优化细节代码实践与案例分析基础用法演示自定义比较器实现最小堆检查边缘情况处理性能分析与实际应用时间复杂度对比典型应用场景与手动实现的对比注意事项与最佳实践迭代器要求比较器设计C++标
冒泡、选择、插入排序：三大基础排序算法深度解析（C语言实现） xienda 算法排序算法数据结构
在算法学习道路上，排序算法是每位程序员必须掌握的基石。本文将深入解析冒泡排序、选择排序和插入排序这三种基础排序算法，通过C语言代码实现和对比分析，帮助读者彻底理解它们的差异与应用场景。算法原理与代码实现1.冒泡排序（BubbleSort）工作原理：通过重复比较相邻元素，将较大元素逐步"冒泡"到数组末尾。voidbubbleSort(intarr[],intn){ for(inti=0;iarr[
Leetcode 148. 排序链表
文章目录前引题目代码（首刷看题解）代码（8.9二刷部分看解析）代码（9.15三刷部分看解析）前引综合性比较强的一道题，要求时间复杂度必须O(logn)才能通过，最适合链表的排序算法就是归并。这里采用自顶向下的方法步骤：找到链表中点（双指针）对两个子链表排序(递归，直到只有一个结点，记得将子链表最后指向nullptr）归并（引入dummy结点）题目Leetcode148.排序链表代码（首刷看题解）c
全面触摸屏输入法设计与实现长野君
本文还有配套的精品资源，点击获取简介：触摸屏输入法是针对触摸设备优化的文字输入方案，包括虚拟键盘、手写、语音识别和手势等多种输入方式。本方案通过提供主程序文件、用户手册、界面截图、示例图、说明文本和音效文件，旨在为用户提供一个完整的、多样的文字输入体验。开发者通过持续优化算法和用户界面，使用户在无物理键盘环境下也能高效准确地进行文字输入。1.触摸屏输入法概述简介在现代信息技术飞速发展的今天，触摸屏
FPGA小白到项目实战：Verilog+Vivado全流程通关指南（附光学类岗位技能映射）阿牛的药铺算法移植部署 fpga开发 verilog
FPGA小白到项目实战：Verilog+Vivado全流程通关指南（附光学类岗位技能映射）引言：为什么这个FPGA入门路线能帮你快速上岗？本文设计了一条**"Verilog语法→工具链操作→光学项目实战→岗位技能对标"的阶梯式学习路径。不同于泛泛而谈的FPGA教程，我们聚焦光学类产品开发**核心能力（时序接口设计、图像处理算法移植、高速接口应用），通过3个递进式项目（从LED闪烁到图像边缘检测），
PyTorch & TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）阿牛的药铺算法移植部署 pytorch tensorflow fpga开发
PyTorch&TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）引言：为什么算法移植工程师必须掌握框架基础？针对光学类产品算法FPGA移植岗位需求（如可见光/红外图像处理），深度学习框架是算法落地的"桥梁"——既要用PyTorch/TensorFlow验证算法可行性，又要将训练好的模型（如CNN、目标检测）转换为FPGA可部署的格式（ONNX、TFLite）。本文采用"
算法学习笔记：17.蒙特卡洛算法 ——从原理到实战，涵盖 LeetCode 与考研 408 例题
在计算机科学和数学领域，蒙特卡洛算法（MonteCarloAlgorithm）以其独特的随机抽样思想，成为解决复杂问题的有力工具。从圆周率的计算到金融风险评估，从物理模拟到人工智能，蒙特卡洛算法都发挥着不可替代的作用。本文将深入剖析蒙特卡洛算法的思想、解题思路，结合实际应用场景与Java代码实现，并融入考研408的相关考点，穿插图片辅助理解，帮助你全面掌握这一重要算法。蒙特卡洛算法的基本概念蒙特卡
算法学习笔记：15.二分查找 ——从原理到实战，涵盖 LeetCode 与考研 408 例题呆呆企鹅仔算法学习算法学习笔记考研二分查找
在计算机科学的查找算法中，二分查找以其高效性占据着重要地位。它利用数据的有序性，通过不断缩小查找范围，将原本需要线性时间的查找过程优化为对数时间，成为处理大规模有序数据查找问题的首选算法。二分查找的基本概念二分查找（BinarySearch），又称折半查找，是一种在有序数据集合中查找特定元素的高效算法。其核心原理是：通过不断将查找范围减半，快速定位目标元素。与线性查找逐个遍历元素不同，二分查找依赖
LeetCode算法题：电话号码的字母组合吱屋猪_ 算法 leetcode java
题目描述：给定一个仅包含数字2-9的字符串，返回所有它能表示的字母组合。答案可以按任意顺序返回。给出数字到字母的映射如下（与电话按键相同）。注意1不对应任何字母。2->"abc"3->"def"4->"ghi"5->"jkl"6->"mno"7->"pqrs"8->"tuv"9->"wxyz"例如，给定digits="23"，返回["ad","ae","af","bd","be","bf","cd
霍夫变换（Hough Transform）算法原来详解和纯C++代码实现以及OpenCV中的使用示例点云SLAM 算法图形图像处理算法 opencv 图像处理与计算机视觉算法直线提取检测目标检测霍夫变换算法
霍夫变换（HoughTransform）是一种经典的图像处理与计算机视觉算法，广泛用于检测图像中的几何形状，例如直线、圆、椭圆等。其核心思想是将图像空间中的“点”映射到参数空间中的“曲线”，从而将形状检测问题转化为参数空间中的峰值检测问题。一、霍夫变换基本思想输入：边缘图像（如经过Canny边缘检测）输出：一组满足几何模型的形状（如直线、圆）关键思想：图像空间中的一个点→参数空间中的一个曲线参数空
Java三年经验程序员技术栈全景指南：从前端到架构，对标阿里美团全栈要求可曾去过倒悬山 java 前端架构
Java三年经验程序员技术栈全景指南：从前端到架构，对标阿里美团全栈要求三年经验是Java程序员的分水岭，技术栈深度决定你成为“业务码农”还是“架构师候选人”。本文整合阿里、美团、滴滴等大厂招聘要求，为你绘制可落地的进阶路线。一、Java核心：从语法糖到JVM底层三年经验与初级的核心差异在于系统级理解，大厂面试常考以下能力：JVM与性能调优内存模型（堆外内存、元空间）、GC算法（G1/ZGC适用场
被动降噪的概念及编程实现 CodeByte 人工智能算法 javascript 编程
被动降噪是指通过编程技术和算法，对输入的数据进行处理，以减少或消除其中的噪声。噪声可以是各种形式的干扰，例如来自传感器、通信信号或其他外部源的干扰。在本文中，我们将探讨被动降噪的意义以及如何使用编程来实现这一目标。被动降噪的意义：噪声对数据的准确性和可靠性产生负面影响。在许多应用领域，例如图像处理、音频处理和信号处理中，噪声的存在可能导致数据质量下降，使得后续的分析和处理变得困难。因此，被动降噪技
传统检测响应慢？陌讯多模态引擎提速90+FPS实战 2501_92473147 算法计算机视觉目标检测
开篇痛点：实时目标检测在安防监控中的核心挑战在安防监控领域，实时目标检测是保障公共安全的关键技术。然而，传统算法如YOLOv5或开源框架MMDetection常面临两大痛点：误报率高（复杂光照或遮挡场景下检测不稳定）和响应延迟（高分辨率视频流处理FPS低于30）。实测数据显示，城市交通监控系统误报率达15%，导致安保资源浪费；客户反馈表明，延迟超100ms时，目标跟踪可能失效。这些问题源于算法泛化
反光衣识别漏检率 30%？陌讯多尺度模型实测优化
在建筑工地、交通指挥等场景中，反光衣是保障作业人员安全的重要装备，对其进行精准识别是智能监控系统的核心功能之一。但传统视觉算法在实际应用中却屡屡碰壁：强光下反光衣易与背景混淆、远距离小目标漏检率高达30%、复杂场景下模型泛化能力不足[实测数据来源：某智慧工地项目2024年Q1日志]。这些问题直接导致安全监控系统预警滞后，给安全生产埋下隐患。一、技术解析：反光衣识别的核心难点与陌讯算法创新反光衣识别
【GESP】C++三级真题 luogu-B4359 [GESP202506 三级] 分糖果 CoderCodingNo GESP c++java 开发语言
GESPC++三级，2025年6月真题，模拟算法，难度★★☆☆☆。本次三级题目个人感觉比较简单。题目题解详见：【GESP】C++三级真题luogu-B4359[GESP202506三级]分糖果|OneCoder【GESP】C++三级真题luogu-B4359[GESP202506三级]分糖果|OneCoderGESPC++三级，2025年6月真题，模拟算法，难度★★☆☆☆。本次三级题目个人感觉比较
【华为机试】HJ61 放苹果不爱熬夜的Coder 算法华为机试 golang 华为 golang 算法面试
文章目录HJ61放苹果描述输入描述输出描述示例1示例2解题思路算法分析问题本质分析状态定义与转移递推关系详解动态规划表构建算法流程图示例推导过程代码实现思路时间复杂度分析关键优化点边界情况处理递归解法对比实际应用场景测试用例分析算法特点数学原理完整题解代码HJ61放苹果描述我们需要将m个相同的苹果放入n个相同的盘子中，允许有的盘子空着不放。求解有多少种不同的分法。输入描述输入两个整数m,n(0B[
深度学习模型表征提取全解析 ZhangJiQun&MXP 教学 2024大模型以及算力 2021 AI python 深度学习人工智能 python embedding 语言模型
模型内部进行表征提取的方法在自然语言处理（NLP）中，“表征（Representation）”指将文本（词、短语、句子、文档等）转化为计算机可理解的数值形式（如向量、矩阵），核心目标是捕捉语言的语义、语法、上下文依赖等信息。自然语言表征技术可按“静态/动态”“有无上下文”“是否融入知识”等维度划分一、传统静态表征（无上下文，词级为主）这类方法为每个词分配固定向量，不考虑其在具体语境中的含义（无法解
.NET中的安全性之数字签名、数字证书、强签名程序集、反编译 hezudao25 NET .net assembly 加密算法 reference header
本文将探讨数字签名、数字证书、强签名程序集、反编译等以及它们在.NET中的运用（一些概念并不局限于.NET在其它技术、平台中也存在）。1.数字签名数字签名又称为公钥数字签名，或者电子签章等，它借助公钥加密技术实现。数字签名技术主要涉及公钥、私钥、非对称加密算法。1.1公钥与私钥公钥是公开的钥匙，私钥则是与公钥匹配的严格保护的私有密钥；私钥加密的信息只有公钥可以解开，反之亦然。在VisualStud
数据结构：导论梁辰兴数据结构学习笔记数据结构导论算法时间复杂度空间复杂度
目录一，数据结构的研究内容二，基本概念与术语（一）数据、数据元素、数据项与数据对象（二）数据结构（三）数据类型与抽象数据类型️三，抽象数据类型的表示与实现⚙️四，算法与算法分析⚖️（一）算法的定义及特性（二）评价算法优劣的基本标准⏱️（三）算法的时间复杂度（四）算法的空间复杂度章结一，数据结构的研究内容数据结构是计算机科学的核心基础，其研究内容可概括为三大维度：数据组织形式：探索如何将现实世界中的
C++ 标准库＜numeric＞
以下对C++标准库中头文件所提供的数值算法与工具做一次系统、深入的梳理，包括算法功能、示例代码、复杂度分析及实践建议。一、概述中定义了一组对数值序列进行累加、内积、差分、扫描等操作的算法，以及部分辅助工具（如std::iota、std::gcd/std::lcm等）。所有算法均作用于迭代器区间，符合STL风格，可与任意容器或原始数组配合使用。从C++17、20起，又陆续加入了并行友好的std::r
具身语义导航算法总揽 Shilong Wang 具身导航算法算法
端到端方法小脑大脑GNMNavDPNaVILAViNTNomadNavidStreamVLNMapNavNavGPTUni-NavidOctoNavNavGPT2模仿学习行为克隆BCDAgger模块化方法GOATVLFMSayPlanLM-NavETPNavVoroNavEmbodiedRAGVL-NavStairwaytoSuccess业内大佬北大王鹤NavidUni-NavidOctoNav吴
【Qualcomm】高通SNPE框架简介、下载与使用 Jackilina_Stone 人工智能 Qualcomm SNPE
目录一高通SNPE框架1SNPE简介2QNN与SNPE3Capabilities4工作流程二SNPE的安装与使用1下载2Setup3SNPE的使用概述一高通SNPE框架1SNPE简介SNPE（SnapdragonNeuralProcessingEngine），是高通公司推出的面向移动端和物联网设备的深度学习推理框架。SNPE提供了一套完整的深度学习推理框架，能够支持多种深度学习模型，包括Pytor
目标检测（object detection）加油吧zkf 目标检测目标检测人工智能计算机视觉
目标检测作为计算机视觉的核心技术，在自动驾驶、安防监控、医疗影像等领域发挥着不可替代的作用。本文将系统讲解目标检测的概念、原理、主流模型、常见数据集及应用场景，帮助读者构建对这一技术的完整认知。一、目标检测的核心概念目标检测（ObjectDetection）是指在图像或视频中自动定位并识别出所有感兴趣的目标的技术。它需要解决两个核心问题：分类（Classification）：确定图像中每个目标的类
android去除gps漂移代码,GPS漂移过滤算法扇贝君
GPS漂移过滤算法基本思想：逐点过滤，再经过基础过滤后，进行判断运动状态，静止状态和运动中。如果静止，则使用电子围栏；如果运动，则先过滤大速度，再过滤加速度，然后过滤距离(包括超大距离，和速度相关距离)。对于要过滤的点，采用之前最近的可靠点，进行替换，同时，无效次数+1，如果后面是有效点，则无效次数-1，如果无效次数归0，认为这个点才是真正可靠点(无效次数为正时，都为要被替换的点)。如果遇到不定点
项目开发日记
框架整理学习UIMgr：一、数据结构与算法1.1关键数据结构成员变量类型说明m_CtrlsList当前正在显示的所有UI页面m_CachesList已打开过、但现在不显示的页面（缓存池）1.2算法逻辑查找缓存页面：从m_Caches中倒序查找是否已有对应ePageType页面，找到则重用。页面加载：从资源管理器ResMgr加载prefab并绑定控制器/视图组件。页面关闭：从m_Ctrls移除，添加
深度学习篇---昇腾NPU&CANN 工具包 Atticus-Orion 上位机知识篇图像处理篇深度学习篇深度学习人工智能 NPU 昇腾 CANN
介绍昇腾NPU是华为推出的神经网络处理器，具有强大的AI计算能力，而CANN工具包则是面向AI场景的异构计算架构，用于发挥昇腾NPU的性能优势。以下是详细介绍：昇腾NPU架构设计：采用达芬奇架构，是一个片上系统，主要由特制的计算单元、大容量的存储单元和相应的控制单元组成。集成了多个CPU核心，包括控制CPU和AICPU，前者用于控制处理器整体运行，后者承担非矩阵类复杂计算。此外，还拥有AICore
深度学习图像分类数据集—桃子识别分类 AI街潜水的八角深度学习图像数据集深度学习分类人工智能
该数据集为图像分类数据集，适用于ResNet、VGG等卷积神经网络，SENet、CBAM等注意力机制相关算法，VisionTransformer等Transformer相关算法。数据集信息介绍：桃子识别分类：['B1','M2','R0','S3']训练数据集总共有6637张图片，每个文件夹单独放一种数据各子文件夹图片统计:·B1:1601张图片·M2:1800张图片·R0:1601张图片·S3:
《C++性能优化指南》 linux版代码及原理解读第一章 v俊逸 C++性能优化指南性能优化 C++性能优化性能优化
概述：目录概述：性能优化的必要性：C++代码优化策略总结用好的编译器并用好编译器使用更好的算法使用更好的库减少内存分配和复制移除计算使用更好的数据结构提高并发性优化内存管理性能优化的必要性：按照当今的CPU运行速度来说，执行一条指令所需要的时间是10的-9次方的时间单位，如此快速的执行速度是否就没有性能优化的必要了呢？其实不然，性能优化与CPU的执行速度并无非常大的关系，试想一下，一段代码，如果用
《C++性能优化指南》 linux版代码及原理解读第四章 v俊逸 C++性能优化指南性能优化 C++性能优化指南性能优化
目录概述为什么字符串很麻烦字符串是动态分配的字符串赋值背后的操作如何面对字符串会进行大量复制写时复制COW（copyonwrite）尝试优化字符串避免临时字符串通过预留存储空间减少内存分配通过传递引用减少实参复制使用迭代器操作减少循环中的比较操作减少返回值的复制还没有结束，使用字符数组代替字符串再次优化字符串尝试其他的算法叠加以前的优化方式使用其他的编译器使用其他字符串的库功能丰富的字符串库使用s
rtos内存管理林内克思 java linux 算法
FreeRTOS将内存分配API保留在其可移植层，提供了五种内存管理算法：heap_1：最简单，不允许释放内存。heap_2：允许释放内存，但不会合并相邻的空闲块。heap_3：简单包装了标准malloc()和free()，以保证线程安全。heap_4：合并相邻的空闲块以避免碎片化。包含绝对地址放置选项。heap_5：如同heap_4，能够跨越多个不相邻内存区域的堆。特点缺点heap_1简单、不支
多线程编程之存钱与取钱周凡杨 java thread 多线程存钱取钱
生活费问题是这样的：学生每月都需要生活费，家长一次预存一段时间的生活费，家长和学生使用统一的一个帐号，在学生每次取帐号中一部分钱，直到帐号中没钱时通知家长存钱，而家长看到帐户还有钱则不存钱，直到帐户没钱时才存钱。问题分析：首先问题中有三个实体，学生、家长、银行账户，所以设计程序时就要设计三个类。其中银行账户只有一个，学生和家长操作的是同一个银行账户，学生的行为是
java中数组与List相互转换的方法征客丶 JavaScript java jsonp
1.List转换成为数组。（这里的List是实体是ArrayList) 　　调用ArrayList的toArray方法。　　toArray 　　public T[] toArray(T[] a)返回一个按照正确的顺序包含此列表中所有元素的数组；返回数组的运行时类型就是指定数组的运行时类型。如果列表能放入指定的数组，则返回放入此列表元素的数组。否则，将根据指定数组的运行时类型和此列表的大小分
Shell 流程控制 daizj 流程控制 if else while case shell
Shell 流程控制和Java、PHP等语言不一样，sh的流程控制不可为空，如(以下为PHP流程控制写法)： <?php if(isset($_GET["q"])){ search(q);}else{// 不做任何事情} 在sh/bash里可不能这么写，如果else分支没有语句执行，就不要写这个else，就像这样 if else if if 语句语
Linux服务器新手操作之二周凡杨 Linux 简单操作
1.利用关键字搜寻Man Pages man -k keyword 其中-k 是选项，keyword是要搜寻的关键字如果现在想使用whoami命令，但是只记住了前3个字符who，就可以使用 man -k who来搜寻关键字who的man命令 [haself@HA5-DZ26 ~]$ man -k
socket聊天室之服务器搭建朱辉辉33 socket
因为我们做的是聊天室，所以会有多个客户端，每个客户端我们用一个线程去实现，通过搭建一个服务器来实现从每个客户端来读取信息和发送信息。我们先写客户端的线程。 public class ChatSocket extends Thread{ Socket socket; public ChatSocket(Socket socket){ this.sock
利用finereport建设保险公司决策分析系统的思路和方法老A不折腾 finereport 金融保险分析系统报表系统项目开发
决策分析系统呈现的是数据页面，也就是俗称的报表，报表与报表间、数据与数据间都按照一定的逻辑设定，是业务人员查看、分析数据的平台，更是辅助领导们运营决策的平台。底层数据决定上层分析，所以建设决策分析系统一般包括数据层处理（数据仓库建设）。项目背景介绍通常，保险公司信息化程度很高，基本上都有业务处理系统（像集团业务处理系统、老业务处理系统、个人代理人系统等）、数据服务系统（通过
始终要页面在ifream的最顶层林鹤霄
index.jsp中有ifream，但是session消失后要让login.jsp始终显示到ifream的最顶层。。。始终没搞定，后来反复琢磨之后，得到了解决办法，在这儿给大家分享下。。 index.jsp--->主要是加了颜色的那一句 <html> <iframe name="top" ></iframe> <ifram
MySQL binlog恢复数据 aigo mysql
1，先确保my.ini已经配置了binlog： # binlog log_bin = D:/mysql-5.6.21-winx64/log/binlog/mysql-bin.log log_bin_index = D:/mysql-5.6.21-winx64/log/binlog/mysql-bin.index log_error = D:/mysql-5.6.21-win
OCX打成CBA包并实现自动安装与自动升级 alxw4616 ocx cab
近来手上有个项目,需要使用ocx控件 (ocx是什么? http://baike.baidu.com/view/393671.htm) 在生产过程中我遇到了如下问题. 1. 如何让 ocx 自动安装? a) 如何签名? b) 如何打包? c) 如何安装到指定目录? 2.
Hashmap队列和PriorityQueue队列的应用百合不是茶 Hashmap队列 PriorityQueue队列
HashMap队列已经是学过了的,但是最近在用的时候不是很熟悉,刚刚重新看以一次, HashMap是K,v键 ,值 put()添加元素 //下面试HashMap去掉重复的 package com.hashMapandPriorityQueue; import java.util.H
JDK1.5 returnvalue实例 bijian1013 java thread java多线程 returnvalue
Callable接口：返回结果并且可能抛出异常的任务。实现者定义了一个不带任何参数的叫做 call 的方法。 Callable 接口类似于 Runnable，两者都是为那些其实例可能被另一个线程执行的类设计的。但是 Runnable 不会返回结果，并且无法抛出经过检查的异常。 ExecutorService接口方
angularjs指令中动态编译的方法(适用于有异步请求的情况) 内嵌指令无效 bijian1013 JavaScript AngularJS
在directive的link中有一个$http请求，当请求完成后根据返回的值动态做element.append('......');这个操作，能显示没问题，可问题是我动态组的HTML里面有ng-click，发现显示出来的内容根本不执行ng-click绑定的方法！
【Java范型二】Java范型详解之extend限定范型参数的类型 bit1129 extend
在第一篇中，定义范型类时，使用如下的方式： public class Generics<M, S, N> { //M,S,N是范型参数 } 这种方式定义的范型类有两个基本的问题： 1. 范型参数定义的实例字段，如private M m = null;由于M的类型在运行时才能确定，那么我们在类的方法中，无法使用m，这跟定义pri
【HBase十三】HBase知识点总结 bit1129 hbase
1. 数据从MemStore flush到磁盘的触发条件有哪些？ a.显式调用flush，比如flush 'mytable' b.MemStore中的数据容量超过flush的指定容量，hbase.hregion.memstore.flush.size,默认值是64M 2. Region的构成是怎么样？ 1个Region由若干个Store组成
服务器被DDOS攻击防御的SHELL脚本 ronin47
mkdir /root/bin vi /root/bin/dropip.sh #!/bin/bash/bin/netstat -na|grep ESTABLISHED|awk ‘{print $5}’|awk -F:‘{print $1}’|sort|uniq -c|sort -rn|head -10|grep -v -E ’192.168|127.0′|awk ‘{if($2!=null&a
java程序员生存手册-craps 游戏-一个简单的游戏 bylijinnan java
import java.util.Random; public class CrapsGame { /** * *一个简单的赌*博游戏，游戏规则如下： *玩家掷两个骰子，点数为1到6，如果第一次点数和为7或11，则玩家胜， *如果点数和为2、3或12，则玩家输， *如果和为其它点数，则记录第一次的点数和，然后继续掷骰，直至点数和等于第一次掷出的点
TOMCAT启动提示NB: JAVA_HOME should point to a JDK not a JRE解决开窍的石头 JAVA_HOME
当tomcat是解压的时候，用eclipse启动正常，点击startup.bat的时候启动报错; 报错如下： The JAVA_HOME environment variable is not defined correctly This environment variable is needed to run this program NB: JAVA_HOME shou
[操作系统内核]操作系统与互联网 comsci 操作系统
我首先申明：我这里所说的问题并不是针对哪个厂商的，仅仅是描述我对操作系统技术的一些看法操作系统是一种与硬件层关系非常密切的系统软件，按理说，这种系统软件应该是由设计CPU和硬件板卡的厂商开发的，和软件公司没有直接的关系，也就是说，操作系统应该由做硬件的厂商来设计和开发
富文本框ckeditor_4.4.7 文本框的简单使用支持IE11 cuityang 富文本框
<html xmlns="http://www.w3.org/1999/xhtml"> <head> <meta http-equiv="Content-Type" content="text/html; charset=UTF-8" /> <title>知识库内容编辑</tit
Property null not found darrenzhu datagrid Flex Advanced propery null
When you got error message like "Property null not found ***", try to fix it by the following way: 1)if you are using AdvancedDatagrid, make sure you only update the data in the data prov
MySQl数据库字符串替换函数使用 dcj3sjt126com mysql 函数替换
需求：需要将数据表中一个字段的值里面的所有的 . 替换成 _ 原来的数据是 site.title site.keywords .... 替换后要为 site_title site_keywords 使用的SQL语句如下： updat
mac上终端起动MySQL的方法 dcj3sjt126com mysql mac
首先去官网下载: http://www.mysql.com/downloads/ 我下载了5.6.11的dmg然后安装,安装完成之后..如果要用终端去玩SQL.那么一开始要输入很长的:/usr/local/mysql/bin/mysql 这不方便啊,好想像windows下的cmd里面一样输入mysql -uroot -p1这样...上网查了下..可以实现滴. 打开终端,输入: 1
Gson使用一（Gson） eksliang json gson
转载请出自出处：http://eksliang.iteye.com/blog/2175401 一.概述从结构上看Json，所有的数据（data）最终都可以分解成三种类型：第一种类型是标量（scalar），也就是一个单独的字符串（string）或数字（numbers），比如"ickes"这个字符串。第二种类型是序列（sequence），又叫做数组（array）
android点滴4 gundumw100 android
Android 47个小知识 http://www.open-open.com/lib/view/open1422676091314.html Android实用代码七段（一） http://www.cnblogs.com/over140/archive/2012/09/26/2611999.html http://www.cnblogs.com/over140/arch
JavaWeb之JSP基本语法 ihuning javaweb
目录 JSP模版元素 JSP表达式 JSP脚本片断 EL表达式 JSP注释特殊字符序列的转义处理如何查找JSP页面中的错误 JSP模版元素 JSP页面中的静态HTML内容称之为JSP模版元素，在静态的HTML内容之中可以嵌套JSP
App Extension编程指南（iOS8/OS X v10.10）中文版啸笑天 ext
当iOS 8.0和OS X v10.10发布后，一个全新的概念出现在我们眼前，那就是应用扩展。顾名思义，应用扩展允许开发者扩展应用的自定义功能和内容，能够让用户在使用其他app时使用该项功能。你可以开发一个应用扩展来执行某些特定的任务，用户使用该扩展后就可以在多个上下文环境中执行该任务。比如说，你提供了一个能让用户把内容分
SQLServer实现无限级树结构 macroli oracle sql SQL Server
表结构如下：数据库id path titlesort 排序 1 0 首页 0 2 0,1 新闻 1 3 0,2 JAVA 2 4 0,3 JSP 3 5 0,2,3 业界动态 2 6 0,2,3 国内新闻 1 创建一个存储过程来实现，如果要在页面上使用可以设置一个返回变量将至传过去 create procedure test as begin decla
Css居中div，Css居中img，Css居中文本，Css垂直居中div qiaolevip 众观千象学习永无止境每天进步一点点 css
/**********Css居中Div**********/ div.center { width: 100px; margin: 0 auto; } /**********Css居中img**********/ img.center { display: block; margin-left: auto; margin-right: auto; }
Oracle 常用操作(实用) 吃猫的鱼 oracle
SQL>select text from all_source where owner=user and name=upper('&plsql_name'); SQL>select * from user_ind_columns where index_name=upper('&index_name'); 将表记录恢复到指定时间段以前
iOS中使用RSA对数据进行加密解密 witcheryne ios rsa iPhone objective c
RSA算法是一种非对称加密算法,常被用于加密数据传输.如果配合上数字摘要算法, 也可以用于文件签名. 本文将讨论如何在iOS中使用RSA传输加密数据. 本文环境 mac os openssl-1.0.1j, openssl需要使用1.x版本, 推荐使用[homebrew](http://brew.sh/)安装. Java 8 RSA基本原理 RS