滢滢码仔

【Unsupervised Image-to-Image Translation with Generative Prior 生成性先验引导的无监督的图像转换 (GPUNIT) 】阅读笔记

一、背景

二、简介

三、相关工作

四、生成性的先验蒸馏法

五、基于对抗学习的图像转化

六、实验结果

七、总结与讨论

一、背景

尽管图像转换有了发展，但要实现巨大的视觉差异还是较为困难。具有预训练类别条件的生成性先验GANs（如BigGAN）被用来学习丰富的内容对应关系，可以进行跨域较大的丰富内容的转换。

本文提出一个新框架，生成性先验引导的无监督的图像转换 (GP-UNIT)Generative Prior guided Unsupervised Image-to-image Translation。新方案由粗到精：提炼生成性先验，捕获一个可以在抽象语义层面连接目标的粗略级别内容表示，在此基础上自适应地学习细级别的内容特征，以获得更准确的多级内容对应。

优势：提升图像转换算法的质量与适用性，在鲁棒性、高质量、多样化的图形生成中效果很好。

二、简介

无监督的图像转换（UNIT）：没有先验数据

主流的UNIT：假设转换的领域之间有转换关系，并利用循环一致性来建立转换的映射。虽然在跨域小的情况下效果较好，如马转斑马，但当跨域较大（形状外观差异较大）时这种方法效果急剧下降，如人脸转动物脸。

在差异较大的领域进行转换，需要在更高的语义层面进行。如人脸转猫脸时，应利用人和猫之间更可靠的面部组件如眼睛的对应关系，而不是利用局部纹理。在跨域更大的情况下，如动物转人造物体，则需在更高的抽象语义层面来确定转换关系，如通过物体方向与物体在图像中布局。

在不同的语义层面建立转化，会降低UNIT模型找到不同语义之间的准确对应关系，训练此模型需要的这种复杂的对应关系，常不存在或不可收集。

【Unsupervised Image-to-Image Translation with Generative Prior 生成性先验引导的无监督的图像转换 (GPUNIT) 】阅读笔记_第1张图片

图2 BigGAN生成，具有高度的内容对应性

通过生成性先验能克服上述问题，取得可喜成果。生成跨越图像对来挖掘出GAN的独特先验，并利用此来指导模型建立有效的、适应性强的跨类内容映射。

BigGAN：覆盖了大量的领域，成熟应用于多领域间转化。

劣势：虽覆盖的领域广，但每个领域的质量与多样性发展受限制。

新方案：任务分解为由粗到精阶段

采用BigGAN进行生成性先验，以学习更稳定的高语义跨域映射关系。训练一个内容编码器，通过从BigGAN生成的内容相关数据中提炼出先验，来提取分解的内容表示。
对抗性学习图像转换，以在多个语义水平上建立更精细的适应性对应关系。将预先训练好的内容编码器应用于特定的翻译生成任务，不受BigGAN生成的影响，并提出一个动态链接模块来学习可适应的对应关系。

提出生成性先验引导的无监督的图像转换GP-UNIT框架，提高【原近领域的无监督的图像转换UNIT】与【BigGAN生成性先验】的质量与适用性。

捕捉各种物体和不对称领域的粗略对应关系，效果超过UNIT
从粗到细的阶段保留了基本的内容特征
在不同的语义层面上，自适应学习在跨域各种物体均适用的对应映射关系

三、相关工作

无监督的图像转换（UNIT）:

无监督：CycleGAN提出循环一致性结论，以建立双向关系。为了更好地捕获领域不变特征，通常使用内容编码器和风格编码器分别提取领域不变内容特征和风格特征。

差异巨大的领域学习表征：COCO-FUNIT提出内容条件的风格编码器，防止转换与目标无关的外观信息。TGaGa使用地标来建立几何映射。TraVeLGAN提出连体网络来取到跨领域的共享语义特征。而U-GAT-IT使用一个注意模块集中注意区分两个域的重要信息。但这些方法对各种转换任务的适应性较差，对此提出新方案：由粗到细，在高度抽象的语义上进行粗级跨域的内容映射，在此基础上再逐步学习适应目标的精细级别的关联。

对抗性图像生成：GAN使用辨别器与生成器竞争的方式，对抗性地逼近真实的图像分布。StyleGAN用生成先验，通过限制生成的图像要在生成空间内，来确保高质量的图像质量。然而StyleGAN是无条件的，只在单一领域或距离较近的领域适用。BigGAN可以在不同的领域中协同处理图像，但往往质量与域内多样性较差。为解决这问题，本文把BigGAN生成的数据提炼出生成性先验，并将此应用于图像的转换中，以此提升生成图像的质量。

四、生成性的先验提取法

4.1 先验的跨域映射：

BigGAN生成的对象尽管来自多个领域，但由于是由同样的噪音潜码z生成的，所以也具有高度的内容相关性。图2显示了BigGAN的生成空间，特征是三个噪音潜码（z1,z2,z3），横跨五个领域。其中每个潜码是指对应关系，如狗和猫间可以观察到细粒度的对应关系，如面部特征和身体姿势。而鸟和车辆的对应关系则不同，可以在方向和图像布局方面观察到粗略的对应关系。尽管领域差异大，但是在高度抽象的语义层面也会有对应关系。

具有相同潜码的对象，在最初的几层是共享相似的代码表征，在此基础上再添加领域的细节。使用这种生成性先验的方式来建立起稳健的映射（使用BigGAN来做丰富的跨领域先验）。缺点有：

质量方面，BigGAN会生成一些不真实的物体，比如图2中狗的身体；
多样性方面
1. 缺乏域内变化（同一域中，狗的纹理或鸟的颜色的多样性有限），导致在UNIT中使用此先验会使得模型对有限的表象过度拟合。
2. BigGAN的基因空间只有ImageNet的1000个域（如图3中的四种家猫），对于实际的UNIT是不够的。

【Unsupervised Image-to-Image Translation with Generative Prior 生成性先验引导的无监督的图像转换 (GPUNIT) 】阅读笔记_第2张图片

图3 BigGAN、StyleGAN、GP-UNIT的生成空间比较。GP-UNIT在遥远领域建立稳健的映射。

StyleGAN具有高质量与多样性的特点，常应用于在一个领域内通过潜码进行属性转移，但只能在单一的领域，不适合我们的任务。后来通过微调可实现StyleGAN的跨域转换，但跨域距离较小。

我们的框架能解决此问题，不是直接约束噪音潜码或图像空间，而是从BigGAN中提炼出一个通用的生成性先验，能独立地标记和训练转换的模块。以此实现多模式翻译（图3(a)），对ImageNet以外的类别进行生成（图3(b)），并在遥远的领域之间建立稳健的映射（图3(c)）。

4.2 使用内容编码器进行事先提炼

BigGAN从两个随机域X和Y中的公共随机潜码z生成的相关图像( x , y )。
训练一个内容编码器Ec来提取BigGAN生成的一对图像它们共享的粗级内容特征，提取出的特征来重构它们的形状和外观。图4(a) 说明了这种用于生成先验精馏的自编码器流水线。
图4(b) 基于内容编码器Ec构建我们的翻译网络。为了简单起见，省略了分类器C。
使用一个解码器F，根据它的内容编码器Ec提取的内容特征Ec ( x )、一个样式编码器Es提取的样式特征Es ( x )和域标签lx来恢复外观x。
进一步利用F的浅层Fs来预测x ( 即由 HTC从 x中提取的实例分割图 xs )的形状。这样的辅助预测可以方便地对数百个领域进行训练。

【Unsupervised Image-to-Image Translation with Generative Prior 生成性先验引导的无监督的图像转换 (GPUNIT) 】阅读笔记_第3张图片

图4 (a)生成性先验蒸馏法流水线 (b)对抗性无监督图像翻译网络

除形状和外观重构外，我们进一步通过3种方式对内容特征进行正则化，以便提升泛化性：

1 ) x和y应共享相同的内容特征；
2 )引入具有梯度反转层R 的分类器C，使得内容特征域具有可辨识性；
3 )将Ec ( x )限制在一个信道上，以消除域信息，并加入固定方差的高斯噪声以提升鲁棒性。

目标函数是：

Larec是一元损失，是计算外观重建的loss，Larec= ( $\overline{x}=F(E_c(x),E_s(x),l_x)$ ，输入内容x) 间的感知loss
Lsrec是一元损失，是形状重建的loss， $L_{srec}=\lambda_sE_x[||F_x(E_c(x),l_x)-x_s||_1]$
Ldis是二元损失，是配对输入缩小了x和y的内容特征之间的距离，用y的内容特征恢复x的形状的loss， $L_{dis}=E_{(x,y)}[||E_c(x)-E_c(y)||_1+\lambda_s||F_s(E_c(y),l_x)-x_s||_1]$
Lreg是一元损失，是引导分类器C最大化分类精度同时推动Ec混淆分类器C，使内容特性具有域-不可知性。L2进一步应用于内容特征 $L_{reg}=E_x[-l_xlogC(R(E_c(x)))]+\lambda_rE_r[||E_c(x)||_2]$

对于Larec，Lsrec和Lreg的一元损失，我们还使用ImageNet 和CelebA - HQ 的真实图像进行训练，使Ec更通用。

一些概念:

L1范数、L2范数

（L1范数是指向量中各个元素绝对值之和，L2范数定义为向量所有元素的平方和的开平方。）

L1范数损失函数，也被称为最小绝对值偏差（LAD），最小绝对值误差（LAE）。总的说来，它是把目标值（Yi)与估计值（f(xi))的绝对差值的总和（S)最小化：

L2范数损失函数，也被称为最小平方误差（LSE）。总的来说，它是把目标值（Yi)与估计值（f(xi))的差值的平方和（S)最小化：

L1范数与L2范数作为损失函数的区别能快速地总结如下：

五、基于对抗学习的图像转化

给定第一阶段预先训练好的固定内容编码器Ec，我们按照第二阶段的标准转移范式来构建我们的翻译网络。由于预先训练好的Ec为内容相似度提供了很好的度量，我们的框架不需要对Ec循环训练，只需要训练出Es即可。

如图4(b)所示，我们的翻译网络接收到内容输入x∈X和风格输入y∈Y，网络分别提取其内容特征Ec(x)和风格特征分别Es(y)。然后生成器G通过AdaIN对Ec(x)进行调节以匹配y的样式，最终生成转化结果yˆ= G( Ec(x)，Es(y) )。yˆ的逼真性通过一个辨别者D的对抗性训练得到加强。

生成的yˆ要符合y的类型，同时保留x原有的内容特征，表述为style loss Lsty和content loss Lcon。其中fD是定义为D的中间层特征上的平均值的样式特征。

5.1 动态跳转链接

语义上接近域的内容对应关系需很细致，不能仅用抽象内容特征来描述。为了解决这一问题，我们提出了一个动态跳转连接模块，该模块将中间层特征从传递到G，并预测掩码m，以此选择有效的元素来建立精细级内容对应。

动态跳转链接的灵感来自于循环神经网络GRU选择转移单元。GRU很聪明的一点就在于，使用同一个门控z就同时可以进行遗忘和选择记忆。

特别地，先设置第一个隐藏状态，使用上采样卷积将 $h^{l-1}$ 与两者维数匹配 $\hat{h}^{l-1}=\sigma (W^l_h o\uparrow h^{l-1})$ ，其中 $\uparrow$ ，o和分别为上采样算子、卷积算子和卷积权重，激活层记为σ。
设上标l表示G中的一层，第l层的掩码由同一层的编码器特征和最后一层的隐藏状态 $h^{l-1}$ 决定。
然后，第l层的模块更新隐藏状态和编码器特征 $\hat{f}^l_E$ 。
并将编码器特征 $\hat{f}^l_E$ 与生成器特征与预测掩码融合

其中[·，·]表示连接。与具有相同的维数，既服务于通道注意，也服务于空间注意。此外，对应用L1范数使其更稀疏，由此达到。只选择源领域中最有用的内容线索。

综合上述损失，我们的完整的目标：

新增重构损失Lrec：来衡量y和 $\overline{y}= G ( E_c ( y ),E_s ( y ) )$ 之间的L1和预知损失,

Lrec=L1(y, $\overline{y}= G ( E_c ( y ),E_s ( y ) )$ )。直观地说，我们希望一个图像的类型特征能够借助其内容特征精确地重构自己，从而使网络训练稳定。

类型采样：

为了在没有该类型图像的情况下，直接采样潜在类型特征进行多模态生成，我们在后处理基础上，使用最大似然准则训练一个映射网络，将单位高斯噪声映射到潜在类型分布上。

六、实验结果

数据集：

在第一阶段，我们准备了合成数据和真实数据。

对于合成的数据：我们使用官方的Big GAN 为291个域(包括动物和车辆)中的每个域生成随机潜码关联的相关图像。经过对低质量图像进行滤波处理，最终得到每一个域655幅图像，这些图像在所有域之间进行链接，其中600幅用于训练。我们将这个数据集表示为synImageNet-291。
对于真实数据：我们将HTC 应用到ImageNet 中，检测并裁剪对象区域。每个域使用600幅图像进行训练。我们将这个数据集表示为ImageNet - 291。
此外，还包括29K的CelebA-HQ人脸图像[ 23,33 ]进行训练。

第二阶段，我们对四个翻译任务进行评估。

1 ) 男性<->女性：CelebA-HQ 的28K训练图像；
2 ) 狗<->猫：AFHQ每域4K训练图像。
3 ) 人脸<->猫：4K AFHQ图像和29K CelebA - HQ图像。
4 )鸟<->狗<->汽车：ImageNet-291中的4类鸟、4类狗和4类汽车。

每四个类组成一个包含2.4K训练图像的域。我们使用“鸟->车”作为极端案例来测试GP-UNIT处理压力测试的能力。

网络训练：

设 λs = 5，λr = 0.001，λ1 = λ3 = λ4 = 1，λ2 = 50
Cat→Human Face，我们新增一个身份loss，权重为1，以保持生成的人脸身份。
动态跳转链接被应用于G的第2层( l = 1 )和第3层( l = 2 )。
除男性<->女性外，我们不使用动态跳转链接去计算Lrec ( 通过将设置为一个全零张量 )。

6.1 与最高水平技术的比较

定性比较

我们对图5和图6中6种最先进的方法进行了可视化比较。相比较而言，我们的方法与上述方法相比，在男性<->女性任务上具有可比性，在其他挑战性任务上表现出一致的优越性。

如图5所示，循环一致性引导的U-GAT-IT 、MUNIT 和StarGAN2 依靠输入图像的低级线索进行双向重建，导致了一些不希望出现的伪影，如带有狗耳朵的扭曲猫脸，以及生成的鸟图像中的吓人的狗腿。
同时，TraVeLGAN 和COCOFuNIT 未能建立合适的人类脸部<->猫、鸟<->汽车的内容对应关系。
在图6中，我们将我们的模型与TGaGa 进行了比较，TGaGa 也处理了范例引导转换中的大型几何变形。TGaGa产生模糊的结果，无法精确匹配示例外观，例如所有生成的人脸

图5 TraVeLGAN, U-GAT-IT, MUNIT, COCO - FUNIT 和StarGAN2 的视觉比较。
GP-UNIT始终优于所有任务，并且随着任务变得更具挑战性，显示出更大的优越性( 从上到下)。

【Unsupervised Image-to-Image Translation with Generative Prior 生成性先验引导的无监督的图像转换 (GPUNIT) 】阅读笔记_第7张图片

图6 与TGaGa2的比较，GP-UNIT在生动细节和风格一致性上超越TGaGa。

定量比较

进行质量和多样性的定量比较。FID 和LPIPS 分别用于评价生成数据与真实数据的图片质量与多样性。对于支持多模态转化的方法( MUNIT, COCO-FNIT, StarGAN2, GPUNIT)，我们每次测试会生成10个配对翻译结果，我们从随机抽取潜在代码或示例图像来计算它们的平均多样性LPIPS距离。表1报告了所有测试图像的平均定量结果，与图5一致，即我们的方法效果达到或优于对比的方法，在困难任务上的优势更加明显，获得了最好的总体FID图像质量和LPIPS多样性。并发现GP-UNIT倾向于保留输入图像的背景。这种性质不利于多样性，但在某些应用中可能是有用的。虽然StarGAN2在Cat→Human Face上产生了逼真的人脸( 获得最好的FID图像质量 )，但它忽略了与输入猫脸的姿态对应关系( 内容一致性低于 GP-UNIT )，如图5所示。

我们进一步进行用户研究来评估输入输出内容的一致性和整体转化性能。共有25名被试参与本研究，从这6种方法中选出他们认为最好的结果，并对50组结果进行了2500次选择。表2总结了平均偏好得分，其中所提方法在内容一致性和整体性能方面都受到显著的偏好。

6.2 消融实验（“控制变量法”地来查看每个部分起到的作用）

消融实验类似于“控制变量法”。假设在某目标检测系统中，使用了A，B，C，取得了不错的效果，但是这个时候你并不知道这不错的效果是由于A，B，C中哪一个起的作用，于是你保留A，B，移除C进行实验来看一下C在整个系统中所起的作用。

生成预提取

如图7 ( a )所示，如果我们在第二阶段与所有其他子网络一起从头开始训练我们的内容编码器Ec，就像大多数图像翻译框架一样，这个变种无法保存诸如眼睛位置等内容特征。相比之下，我们的预训练内容编码器预先成功地利用了生成器来更高效地构建有效的内容映射。指出了粗级内容特征的必要性，只有在此基础上才能学习有效的细级特征。因此，生成性先验是我们内容对应学习由粗到细方案成功的关键。

动态跳转连接

如图7 ( b )所示，在没有动态跳转连接( DSC )的情况下，模型不能保持鼻子和眼睛在内容图像中的相对位置。我们用全模型预测的掩模的第135和301通道有效地定位了这些特征，内容映射更为准确。

多层次的跨域对应

图8分析了学习到的多层次的跨域对应关系。最抽象的只给出布局线索。如果我们只使用 ( 通过将掩模和同时设置为0 )，则会导致得到的虎和狗脸没有细节。

关注中层细节，如在第305通道中猫脸的鼻子和眼睛，以及第85通道中人脸的眼睛等，这足以用生成一个逼真的结果。
关注细微细节，用于近域，如第169通道中的猫须。

因此，我们的全多级内容特性使我们能够模拟极细级的长晶须。正如预期的那样，在更远的人和狗脸之间没有发现这种精细的对应关系，从而阻止了来自源域不必要的外观影响( 如图 5中生成的猫脸上的衣服 )。需要注意的是，这种合理的、适应性强的语义注意仅仅是通过先前的生成来学习的，没有任何明确的对应监督。

损失函数

图9研究了损失file:///C:/Users/Administrator/Desktop/a.png函数的影响。

在第一阶段（内容编码器Ec）

Lsrec是学习正确内容特征的关键，或者没有建立对应关系。
Lreg使得内容特征更加稀疏，以提高对不重要领域特定细节的鲁棒性。
Ldis从源域(如狗尾巴)中发现领域共享特征以防止输出受到对象的影响。

在第二阶段（风格编码器）

Lcon有助于加强对应位姿。
而Lsty则使输出更好地与示例图像的风格相匹配。

6.3 更多结果

泛化到BigGAN以外的领域

图10展示了物种转移、季节转移和面部造型三个应用。即使MS-COCO长颈鹿、Yosemite景观和Art肖像不在ImageNet 1000类中，同时也不被第一阶段的内容编码器所观测到，我们的方法能够很好地支持这些领域，并产生逼真的结果。

看不见的视图合成

图11显示了我们根据头部姿态图像数据库中的参考人脸在不同角度下合成的真实人脸和猫脸。为了转移身份和防止低水平的内容联系，我们添加了identity loss，并在计算Lrec时不使用DSC。

在计算Lrec时使用DSC：可以灵活地控制要传递的面部属性( 如图12 )，有助于保存面部内容的个体身份，适用于性别转移和颜色转移。（更注重content，注重细节）
使用identity loss，在计算Lrec时不使用DSC：除了姿态外，风格面的大部分属性都可以转移，适合于姿态转移。（更注重style，注重中层次）

【Unsupervised Image-to-Image Translation with Generative Prior 生成性先验引导的无监督的图像转换 (GPUNIT) 】阅读笔记_第15张图片

图12 灵活的多级属性转移

6.4 出现的问题

图13给出了我们方法的三个典型失败案例。

缺乏语义监督问题：仅从外观很难学到某些语义对应，比如汽车的哪一边是它的前部。我们观察到，鸟尾往往被翻译成汽车的前部，因为它们都是物体的较薄部分。
不平衡的训练数据问题：由于缺乏鸟直接看摄像机的训练图像，我们的方法未能生成与狗共享头部方向的鸟。因此，在使用该方法时，要注意可能出现数据不平衡问题，特别是数据集中的少数群体。
比例不匹配问题：当content内容图像和style风格图像中的对象具有非常不同的比例时，一些外观特征无法正确呈现。

七、总结与讨论

在本文中，我们在GAN生成之前建立了一个通用的UNIT框架。

我们的研究表明，提出的两阶段框架能够在高语义水平上表征内容的对应关系，以应对遥远域之间具有挑战性的多模态转化任务。这样做的一个优点是，只要进行域监督(即只知道每个图像所属的域)，就可以发现这些内容的对应关系。

我们在第6.2节进一步发现，精细级别的内容关系仅通过生成任务就可以习得。这可能暗示了深度神经网络的一种有趣的行为，即通过从粗到细的方式自动查找和集成跨域的共享外观特征，以重建各种对象。它提出了一种生成学习的潜能：

通过生成和转换来构建对象关系。
另一个有趣的话题是学习对象外观之外的语义对应，例如在6.4节中的对象的正面。一个可能的方向是semi-supervised learning半监督学习，其中可标记少量数据以指定对应的语义。

参考：

欧氏距离,l2范数,l2-loss,l2正则化_Accelerating的博客-CSDN博客_l2范数计算公式范数、L1范数和L2范数的基本概念_lioncv的博客-CSDN博客_l2范数欧氏距离,l2范数,l2-loss,l2正则化_Accelerating的博客-CSDN博客_l2范数计算公式

Python编程电子书：从基础到实践王奥雷
本文还有配套的精品资源，点击获取简介：Python电子书汇集了基础语法、面向对象编程、标准及第三方库使用、文件操作、网络编程、并发编程、单元测试与调试、Python2与Python3的区别等核心知识点。通过实例和项目案例，帮助读者在Web开发、数据分析、人工智能等应用领域提升编程技能，跟上Python的技术进步。1.Python基础语法介绍Python作为一种高级编程语言，其易读性和简洁的语法使其
本地搭建区块链服务的详细指南
以下是一个在本地搭建区块链服务的详细指南，使用Ethereum作为示例（因其工具链完善且适合开发），包含从环境准备到实际操作的完整流程：一、本地区块链搭建方案（基于Ethereum）核心组件组件推荐工具作用区块链节点Ganache(测试链)模拟以太坊网络，零配置启动开发框架Hardhat或Truffle智能合约编译/部署/测试钱包交互MetaMask账户管理&交易签名前端界面React+ether
开源模型应用落地-OpenAI Agents SDK-集成MCP与Qwen3-8B模型的创新应用探索（七）开源技术探险家开源模型-实际应用落地开源 python ai 人工智能
一、前言在人工智能技术飞速发展的今天，如何将先进的模型和技术无缝结合，成为推动行业变革的关键。OpenAIAgents通过集成模型上下文协议（MCP）和阿里巴巴推出的Qwen3-8B模型，正开启一场智能应用的革命。这种创新的结合不仅提升了AI代理与外部工具之间的通信能力，还在多模态任务处理、个性化服务等领域展现出巨大潜力。本文将深入探讨这一技术组合的实际应用场景，揭示其在改善客户体验和提升运营效率
开源模型应用落地-OpenAI Agents SDK-集成Qwen3-8B-探索output_guardrail的创意应用（六）开源技术探险家开源模型-实际应用落地开源 python ai 人工智能
一、前言随着人工智能技术的迅猛发展，大语言模型（LLM）在各行各业的应用日益广泛。然而，模型生成的内容是否安全、合规、符合用户预期，成为开发者和企业不可忽视的问题。为此，OutputGuardrail应运而生，作为一种关键的安全机制，它在模型生成结果之后进行内容审核与过滤，确保输出不偏离道德、法律和业务规范。通过检测不当的内容，不仅提升了AI系统的可信度，也为构建更加稳健和负责任的人工智能应用提供
什么是深度学习框架中的计算图？杰瑞学AI Computer knowledge NLP/LLMs AI/AGI 深度学习人工智能 pytorch
在深度学习框架中，计算图是核心的数据结构和抽象概念，它用来表示和定义深度学习模型的计算过程。我们可以把它想象成一个描述数学运算如何组合和执行的有向图。以下是计算图的关键要素和作用：节点：代表操作或变量。操作：数学运算，如加法(+)、乘法(*)、矩阵乘法(matmul)、激活函数(ReLU,sigmoid)、卷积(conv2d)、损失函数(cross_entropy)等。变量：通常是张量，即存储数据
开源模型应用落地-让AI更懂你的每一次交互-Mem0集成Qdrant、Neo4j与Streamlit的创新实践（四）开源技术探险家开源模型-实际应用落地 neo4j 开源人工智能语言模型
一、前言在人工智能迅速发展的今天，如何让AI系统更懂“你”？答案或许藏在个性化的记忆管理之中。Mem0作为一个开源的记忆管理系统，正致力于为AI赋予长期记忆与个性化服务能力。通过结合高性能向量数据库Qdrant、图数据库Neo4j的强大关系分析能力以及Streamlit的高效可视化交互，我们可以打造出一个既能存储用户历史行为、又能实时推理并展示结果的智能记忆助手。本文将带您一步步探索这一技术组合的
【优秀文章】7月优秀文章推荐
优秀文章智能自主运动体与人工智能技术——环境感知、SLAM定位、路径规划、运动控制、多智能体协同作者：fpga和matlabC++之红黑树认识与实现作者：zzh_zao【手把手带你刷好题】–C语言基础编程题(十)作者：草莓熊Lotso飞算JavaAI：从“码农”到“代码指挥官”的终极进化论作者：可涵不会debug前端网页开发学习（HTML+CSS+JS）有这一篇就够！作者：一颗小谷粒
蛋白质结构预测/功能注释/交互识别/按需设计，中国海洋大学张树刚团队直击蛋白质智能计算核心任务 hyperai
蛋白质作为生命活动的主要承担者，在人体生理功能中扮演关键角色。然而传统研究面临结构解析成本高昂、功能注释严重滞后、新型蛋白质设计效率低下等挑战。近年来，生命科学对蛋白质复杂特性解析的需求日益迫切，大数据、深度学习、多模态计算等技术的突破性发展，为构建蛋白质智能计算体系提供了全新的发展契机。蛋白质智能计算体系的构建，使得蛋白质在大规模功能注释、交互预测及三维结构建模等领域取得显著成果，为药物发现与生
【心灵鸡汤】深度学习技能形成树：从零基础到AI专家的成长路径全解析智算菩萨人工智能深度学习
引言：技能树的生长哲学在这个人工智能浪潮汹涌的时代，深度学习犹如一棵参天大树，其根系深深扎入数学与计算科学的沃土，主干挺拔地承载着机器学习的核心理念，而枝叶则繁茂地延伸至计算机视觉、自然语言处理、强化学习等各个应用领域。对于初入此领域的新手而言，理解这棵技能树的生长规律，掌握其形成过程中的关键节点和发展阶段，将直接决定其在人工智能道路上能够走多远、攀多高。技能树的概念源于游戏设计，但在学习深度学习
MongoDB + Voyage AI 详解：重塑数据库与AI的协同范式 csdn_tom_168 NoSQL 数据库 mongodb 人工智能 AI
MongoDB+VoyageAI详解：重塑数据库与AI的协同范式2025年2月，MongoDB官方宣布收购VoyageAI，这一举措标志着数据库与人工智能技术的深度融合迈入新阶段。通过整合VoyageAI的先进AI检索与嵌入模型能力，MongoDB旨在重新定义AI时代的数据库架构，为企业构建智能应用提供端到端的数据基础设施。一、收购背景与技术战略1.行业趋势驱动AI数据挑战：随着生成式AI与大语言
HarmonyOS5.0仓颉引擎与盘古大模型：个性化作业批改系统架构设计与实现 H老师带你学鸿蒙系统架构 HarmonyOS5.0 鸿蒙华为仓颉教育
人工智能与边缘计算的融合正在重塑教育评价体系。本文将展示如何基于HarmonyOS5.0仓颉并发引擎和盘古大模型，构建新一代智能作业批改系统。系统架构全景graphTDA[学生端设备]-->|提交作业|B[仓颉边缘处理]B-->C[盘古大模型分析]C-->D[个性化反馈生成]D-->E[学生终端]D-->F[教师仪表盘]subgraphHarmonyOS分布式系统B-->|设备协同|G[教室平板集
阿里云瑶池数据库 Data Agent for Meta 正式发布，让 AI 更懂你的业务！数据库观点资讯人工智能
背景随着生成式人工智能（GenerativeAI）从概念验证迈向规模化商业落地，AIAgent已成为企业核心业务流程的重要组成部分。然而，当模型调用日益便捷时，核心痛点已不再是模型本身，而是集中在一个关键要素上：数据。AIAgent的落地瓶颈已从技术能力转向高质量、高相关性、安全合规的数据供给。企业面临的核心挑战在于：数据孤岛导致知识库分散，通用大模型难以理解专业业务传统数据管理依赖人工开发维护，
【TVM 教程】如何处理 TVM 报错
ApacheTVM是一个深度的深度学习编译框架，适用于CPU、GPU和各种机器学习加速芯片。更多TVM中文文档可访问→https://tvm.hyper.ai/运行TVM时，可能会遇到如下报错：---------------------------------------------------------------AnerroroccurredduringtheexecutionofTVM.F
【PaddleOCR】OCR文本检测与文本识别数据集整理，持续更新......
博主简介：曾任某智慧城市类企业算法总监，目前在美国市场的物流公司从事高级算法工程师一职，深耕人工智能领域，精通python数据挖掘、可视化、机器学习等，发表过AI相关的专利并多次在AI类比赛中获奖。CSDN人工智能领域的优质创作者，提供AI相关的技术咨询、项目开发和个性化解决方案等服务，如有需要请站内私信或者联系任意文章底部的的VX名片（ID：xf982831907）博主粉丝群介绍：①群内初中生、
多模态大模型的技术应用与未来展望：重构AI交互范式的新引擎 zhaoyi_he 重构人工智能
一、引言：为什么多模态是AI发展的下一场革命？过去十年，深度学习推动了计算机视觉和自然语言处理的飞跃，但两者的发展路径长期割裂。随着生成式AI和大模型时代的到来，**多模态大模型（MultimodalFoundationModels）**以统一的建模方式处理图像、文本、音频、视频等多源数据，重塑了“感知-认知-决策”链条，为AGI迈出关键一步。OpenAI的GPT-4o、Google的Gemini
使用 C++ 实现 MFCC 特征提取与说话人识别系统 whoarethenext c++开发语言 mfcc 语音识别
使用C++实现MFCC特征提取与说话人识别系统在音频处理和人工智能领域，C++凭借其卓越的性能和对硬件的底层控制能力，在实时音频分析、嵌入式设备和高性能计算场景中占据着不可或缺的地位。本文将引导你了解如何使用C++库计算核心的音频特征——梅尔频率倒谱系数(MFCCs)，并进一步利用这些特征构建一个说话人识别（声纹识别）系统。Part1:在C/C++中计算MFCCs直接从零开始实现MFCC的所有计算
ImportError: /nvidia/cusparse/lib/libcusparse.so.12: undefined symbol: __nvJitLinkComplete_12_4 爱编程的喵喵 Python基础课程 python ImportError torch nvJitLink 解决方案
大家好，我是爱编程的喵喵。双985硕士毕业，现担任全栈工程师一职，热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多次Top名次。现为CSDN博客专家、人工智能领域优质创作者。喜欢通过博客创作的方式对所学的知识进行总结与归纳，不仅形成深入且独到的理解，而且能够帮助新手快速入门。本文主要介绍了ImportError:/home/
【机器学习&深度学习】多分类评估策略一叶千舟深度学习【理论】深度学习【应用必备常识】大数据人工智能
目录前言一、多分类3大策略✅宏平均（MacroAverage）✅加权平均（WeightedAverage）✅微平均（MicroAverage）二、类比理解2.1宏平均（MacroAverage）2.1.1计算方式2.1.2适合场景2.1.3宏平均不适用的场景2.1.4宏平均一般用在哪些指标上？2.1.5怎么看macroavg指标？2.1.6宏平均值低说明了什么？2.1.7从宏平均指标中定位模型短板
网络安全相关专业总结（非常详细）零基础入门到精通，收藏这一篇就够了网络安全工程师教学兼职副业黑客技术网络安全 web安全安全人工智能网络运维
一、网络工程专业专业内涵网络工程是指按计划进行的以工程化的思想、方式、方法，设计、研发和解决网络系统问题的工程，一般指计算机网络系统的开发与构建。该专业培养具备计算机科学与技术学科理论基础，掌握网络技术领域专业知识和基本技能，在计算机、网络及人工智能领域的工程实践和应用方面受到良好训练，具有深厚通信背景、可持续发展、能力较强的高水平工程技术人才。学生可在计算机软硬件系统、互联网、移动互联网及新一代
OpenCV 图像操作：颜色识别、替换与水印添加
目录引言代码实现1.导入必要的库2.图像加法3.图像直接相加4.颜色加权加法5.HSV颜色空间转换概念作用6.查找颜色范围对应的像素点7.与运算-生成掩膜8.添加水印9.主函数总结引言在计算机视觉领域，OpenCV是一个强大的库，提供了丰富的图像操作功能。本文将详细介绍如何使用OpenCV进行图像加法、颜色加权加法、HSV颜色空间转换、颜色范围查找、与运算生成掩膜以及添加水印等操作，并给出相应的P
大语言模型应用指南：ReAct 框架 AI大模型应用实战 java python javascript kotlin golang 架构人工智能
大语言模型应用指南：ReAct框架关键词：大语言模型,ReAct框架,自然语言处理(NLP),模型融合,多模态学习,深度学习,深度学习框架1.背景介绍1.1问题由来近年来，深度学习技术在自然语言处理(NLP)领域取得了显著进展。尤其是大语言模型(LargeLanguageModels,LLMs)，如BERT、GPT系列等，通过在大规模无标签数据上进行预训练，获得了强大的语言理解和生成能力。然而，预
大语言模型原理基础与前沿基于语言反馈进行微调 AI天才研究院计算 AI大模型企业级应用开发实战 AI人工智能与大数据计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
大语言模型原理基础与前沿基于语言反馈进行微调作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来随着深度学习技术的飞速发展，自然语言处理（NLP）领域取得了显著的进展。大语言模型（LargeLanguageModels，LLMs）如GPT-3、BERT等在各项NLP任务上取得了令人瞩目的成绩。然而，如何进一步提高大语言模型的理
《北京市加快推动“人工智能+医药健康“创新发展行动计划（2025-2027年）》深度解读
引言随着新一轮科技革命和产业变革的深入推进，人工智能技术与医药健康的深度融合已成为全球科技创新的重要方向。北京市于2025年7月正式发布《北京市加快推动"人工智能+医药健康"创新发展行动计划（2025-2027年）》，旨在充分发挥北京在人工智能技术策源、头部医疗资源汇聚、健康数据高度富集等方面的突出优势，构建形成"人工智能+医药健康"创新和应用并举的产业生态体系，打造具有国际影响力的创新策源地、应
「源力觉醒创作者计划」_文心大模型开源：开启 AI 新时代的大门小黄编程快乐屋人工智能
在人工智能的浩瀚星空中，大模型技术宛如一颗璀璨的巨星，照亮了无数行业前行的道路。自诞生以来，大模型凭借其强大的语言理解与生成能力，引发了全球范围内的技术变革与创新浪潮。百度宣布于6月30日开源文心大模型4.5系列，这一消息如同一颗重磅炸弹，在AI领域掀起了惊涛骇浪，其影响之深远，意义之重大，足以改写行业的发展轨迹。百度这次放大招，直接把文心大模型4.5开源了，这操作就像往国内AI圈子里空投了一个超
四种微调技术详解：SFT 监督微调、LoRA 微调、P-tuning v2、Freeze 监督微调方法
当谈到人工智能大语言模型的微调技术时，我们进入了一个令人兴奋的领域。这些大型预训练模型，如GPT-3、BERT和T5，拥有卓越的自然语言处理能力，但要使它们在特定任务上表现出色，就需要进行微调，以使其适应特定的数据和任务需求。在这篇文章中，我们将深入探讨四种不同的人工智能大语言模型微调技术：SFT监督微调、LoRA微调方法、P-tuningv2微调方法和Freeze监督微调方法。第一部分：SFT监
2023年搜索领域的技术认证与职业发展指南搜索引擎技术搜索引擎 ai
2023年搜索领域的技术认证与职业发展指南关键词搜索领域、技术认证、职业发展、搜索引擎技术、人工智能搜索摘要本指南旨在为搜索领域的从业者和有志于进入该领域的人士提供全面的技术认证与职业发展参考。首先介绍搜索领域的概念基础，包括其历史发展和关键问题。接着阐述相关理论框架，分析不同认证背后的原理。架构设计部分展示搜索系统的组成与交互。实现机制探讨算法复杂度和代码优化。实际应用部分给出实施和部署策略。高
探索AI人工智能医疗NLP实体识别系统的架构设计 AI学长带你学AI 人工智能自然语言处理 easyui ai
探索AI人工智能医疗NLP实体识别系统的架构设计关键词：人工智能、医疗NLP、实体识别、系统架构、深度学习、自然语言处理、医疗信息化摘要：本文将深入探讨医疗领域NLP实体识别系统的架构设计。我们将从基础概念出发，逐步解析医疗文本处理的特殊性，详细介绍实体识别技术的核心原理，并通过实际案例展示如何构建一个高效可靠的医疗实体识别系统。文章还将探讨当前技术面临的挑战和未来发展方向，为医疗AI领域的从业者
AI智能体原理及实践：从概念到落地的全链路解析 you的日常人工智能大语言模型人工智能机器学习深度学习神经网络自然语言处理
AI智能体正从实验室走向现实世界，成为连接人类与数字世界的桥梁。它代表了人工智能技术从"知"到"行"的质变，是能自主感知环境、制定决策、执行任务并持续学习的软件系统。在2025年，AI智能体已渗透到智能家居、企业服务、医疗健康、教育和内容创作等领域，展现出强大的生产力与创造力。然而，其发展也伴随着技术挑战、伦理困境和安全风险，需要从架构设计到落地应用的全链条思考与平衡。一、AI智能体的核心定义与技
人工智能动画展示人类的特征 AGI大模型与大数据研究院 AI大模型应用开发实战 java python javascript kotlin golang 架构人工智能
人工智能，动画，人类特征，情感识别，行为模拟，机器学习，深度学习，自然语言处理1.背景介绍人工智能（AI）技术近年来发展迅速，已渗透到生活的方方面面。从智能语音助手到自动驾驶汽车，AI正在改变着我们的世界。然而，尽管AI技术取得了令人瞩目的成就，但它仍然难以完全模拟人类的复杂行为和特征。人类的特征是多方面的，包括情感、认知、社交和创造力等。这些特征是人类区别于其他生物的重要标志，也是人类社会文明发
深度学习篇---简单果实分类网络
下面我将提供一个使用Python从零实现果实分类模型的完整流程，包括数据准备、模型构建、训练和部署，不依赖任何深度学习框架，仅使用NumPy进行数值计算。1.数据准备与预处理首先需要准备果实图像数据集，将其分为好果和坏果两类，并进行预处理：importosimportnumpyasnpfromPILimportImagefromsklearn.model_selectionimporttrain_
继之前的线程循环加到窗口中运行 3213213333332132 java thread JFrame JPanel
之前写了有关java线程的循环执行和结束，因为想制作成exe文件，想把执行的效果加到窗口上，所以就结合了JFrame和JPanel写了这个程序，这里直接贴出代码，在窗口上运行的效果下面有附图。 package thread; import java.awt.Graphics; import java.text.SimpleDateFormat; import java.util
linux 常用命令 BlueSkator linux 命令
1.grep 相信这个命令可以说是大家最常用的命令之一了。尤其是查询生产环境的日志，这个命令绝对是必不可少的。但之前总是习惯于使用（grep -n 关键字文件名）查出关键字以及该关键字所在的行数，然后再用（sed -n '100,200p' 文件名），去查出该关键字之后的日志内容。但其实还有更简便的办法，就是用（grep -B n、-A n、-C n 关键
php heredoc原文档和nowdoc语法 dcj3sjt126com PHP heredoc nowdoc
<!doctype html> <html lang="en"> <head> <meta charset="utf-8"> <title>Current To-Do List</title> </head> <body> <?
overflow的属性周华华 JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
《我所了解的Java》——总体目录 g21121 java
准备用一年左右时间写一个系列的文章《我所了解的Java》，目录及内容会不断完善及调整。在编写相关内容时难免出现笔误、代码无法执行、名词理解错误等，请大家及时指出，我会第一时间更正。 &n
[简单]docx4j常用方法小结 53873039oycg docx
本代码基于docx4j-3.2.0，在office word 2007上测试通过。代码如下: import java.io.File; import java.io.FileInputStream; import ja
Spring配置学习云端月影 spring配置
首先来看一个标准的Spring配置文件 applicationContext.xml <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi=&q
Java新手入门的30个基本概念三 aijuans java 新手 java 入门
17.Java中的每一个类都是从Object类扩展而来的。　　18.object类中的equal和toString方法。　　equal用于测试一个对象是否同另一个对象相等。　　toString返回一个代表该对象的字符串,几乎每一个类都会重载该方法,以便返回当前状态的正确表示.(toString 方法是一个很重要的方法)　　 19.通用编程:任何类类型的所有值都可以同object类性的变量来代替。　
《2008 IBM Rational 软件开发高峰论坛会议》小记 antonyup_2006 软件测试敏捷开发项目管理 IBM 活动
我一直想写些总结,用于交流和备忘,然都没提笔,今以一篇参加活动的感受小记开个头,呵呵! 其实参加《2008 IBM Rational 软件开发高峰论坛会议》是9月4号,那天刚好调休.但接着项目颇为忙,所以今天在中秋佳节的假期里整理了下. 参加这次活动是一个朋友给的一个邀请书,才知道有这样的一个活动,虽然现在项目暂时没用到IBM的解决方案,但觉的参与这样一个活动可以拓宽下视野和相关知识.
PL/SQL的过程编程,异常,声明变量,PL/SQL块百合不是茶 PL/SQL的过程编程异常 PL/SQL块声明变量
PL/SQL; 过程; 符号; 变量; PL/SQL块; 输出; 异常; PL/SQL 是过程语言(Procedural Language)与结构化查询语言(SQL)结合而成的编程语言PL/SQL 是对 SQL 的扩展,sql的执行时每次都要写操作
Mockito(三)--完整功能介绍 bijian1013 持续集成 mockito 单元测试
mockito官网：http://code.google.com/p/mockito/，打开documentation可以看到官方最新的文档资料。一.使用mockito验证行为 //首先要import Mockito import static org.mockito.Mockito.*; //mo
精通Oracle10编程SQL(8)使用复合数据类型 bijian1013 oracle 数据库 plsql
/* *使用复合数据类型 */ --PL/SQL记录 --定义PL/SQL记录 --自定义PL/SQL记录 DECLARE TYPE emp_record_type IS RECORD( name emp.ename%TYPE, salary emp.sal%TYPE, dno emp.deptno%TYPE ); emp_
【Linux常用命令一】grep命令 bit1129 Linux常用命令
grep命令格式 grep [option] pattern [file-list] grep命令用于在指定的文件(一个或者多个,file-list)中查找包含模式串(pattern)的行,[option]用于控制grep命令的查找方式。 pattern可以是普通字符串，也可以是正则表达式，当查找的字符串包含正则表达式字符或者特
mybatis3入门学习笔记白糖_ sql ibatis qq jdbc 配置管理
MyBatis 的前身就是iBatis，是一个数据持久层(ORM)框架。 MyBatis 是支持普通 SQL 查询，存储过程和高级映射的优秀持久层框架。MyBatis对JDBC进行了一次很浅的封装。以前也学过iBatis，因为MyBatis是iBatis的升级版本，最初以为改动应该不大，实际结果是MyBatis对配置文件进行了一些大的改动，使整个框架更加方便人性化。
Linux 命令神器：lsof 入门 ronin47 lsof
lsof是系统管理/安全的尤伯工具。我大多数时候用它来从系统获得与网络连接相关的信息，但那只是这个强大而又鲜为人知的应用的第一步。将这个工具称之为lsof真实名副其实，因为它是指“列出打开文件（lists openfiles）”。而有一点要切记，在Unix中一切（包括网络套接口）都是文件。有趣的是，lsof也是有着最多
java实现两个大数相加，可能存在溢出。 bylijinnan java实现
import java.math.BigInteger; import java.util.regex.Matcher; import java.util.regex.Pattern; public class BigIntegerAddition { /** * 题目：java实现两个大数相加，可能存在溢出。 * 如123456789 + 987654321
Kettle学习资料分享，附大神用Kettle的一套流程完成对整个数据库迁移方法 Kai_Ge Kettle
Kettle学习资料分享 Kettle 3.2 使用说明书目录概述..........................................................................................................................................7 1.Kettle 资源库管
[货币与金融]钢之炼金术士 comsci 金融
自古以来,都有一些人在从事炼金术的工作.........但是很少有成功的那么随着人类在理论物理和工程物理上面取得的一些突破性进展...... 炼金术这个古老
Toast原来也可以多样化 dai_lm android toast
Style 1：默认 Toast def = Toast.makeText(this, "default", Toast.LENGTH_SHORT); def.show(); Style 2：顶部显示 Toast top = Toast.makeText(this, "top", Toast.LENGTH_SHORT); t
java数据计算的几种解决方法3 datamachine java hadoop ibatis r-langue r
4、iBatis 简单敏捷因此强大的数据计算层。和Hibernate不同，它鼓励写SQL，所以学习成本最低。同时它用最小的代价实现了计算脚本和JAVA代码的解耦，只用20%的代价就实现了hibernate 80%的功能,没实现的20%是计算脚本和数据库的解耦。复杂计算环境是它的弱项，比如：分布式计算、复杂计算、非数据
向网页中插入透明Flash的方法和技巧 dcj3sjt126com html Web Flash
将 Flash 作品插入网页的时候，我们有时候会需要将它设为透明，有时候我们需要在Flash的背面插入一些漂亮的图片，搭配出漂亮的效果……下面我们介绍一些将Flash插入网页中的一些透明的设置技巧。　　一、Swf透明、无坐标控制　　首先教大家最简单的插入Flash的代码，透明，无坐标控制：　　注意wmode="transparent"是控制Flash是否透明
ios UICollectionView的使用 dcj3sjt126com
UICollectionView的使用有两种方法，一种是继承UICollectionViewController，这个Controller会自带一个UICollectionView；另外一种是作为一个视图放在普通的UIViewController里面。个人更喜欢第二种。下面采用第二种方式简单介绍一下UICollectionView的使用。 1.UIViewController实现委托，代码如
Eos平台java公共逻辑蕃薯耀 Eos平台java公共逻辑 Eos平台 java公共逻辑
Eos平台java公共逻辑 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年6月1日 17:20:4
SpringMVC4零配置--Web上下文配置【MvcConfig】 hanqunfeng springmvc4
与SpringSecurity的配置类似，spring同样为我们提供了一个实现类WebMvcConfigurationSupport和一个注解@EnableWebMvc以帮助我们减少bean的声明。 applicationContext-MvcConfig.xml  <
解决ie和其他浏览器poi下载excel文件名乱码 jackyrong Excel
使用poi,做传统的excel导出，然后想在浏览器中，让用户选择另存为，保存用户下载的xls文件，这个时候，可能的是在ie下出现乱码（ie,9,10,11),但在firefox,chrome下没乱码，因此必须综合判断，编写一个工具类： /** * * @Title: pro
挥洒泪水的青春 lampcy 编程生活程序员
2015年2月28日，我辞职了，离开了相处一年的触控，转过身--挥洒掉泪水，毅然来到了兄弟连，背负着许多的不解、质疑——”你一个零基础、脑子又不聪明的人，还敢跨行业，选择Unity3D？“，”真是不自量力••••••“，”真是初生牛犊不怕虎•••••“，••••••我只是淡淡一笑，拎着行李----坐上了通向挥洒泪水的青春之地——兄弟连！这就是我青春的分割线，不后悔，只会去用泪水浇灌——已经来到
稳增长之中国股市两点意见-----严控做空，建立涨跌停版停牌重组机制 nannan408
对于股市，我们国家的监管还是有点拼的，但始终拼不过飞流直下的恐慌，为什么呢？笔者首先支持股市的监管。对于股市越管越荡的现象，笔者认为首先是做空力量超过了股市自身的升力，并且对于跌停停牌重组的快速反应还没建立好，上市公司对于股价下跌没有很好的利好支撑。我们来看美国和香港是怎么应对股灾的。美国是靠禁止重要股票做空，在
动态设置iframe高度(iframe高度自适应) Rainbow702 JavaScript iframe contentDocument 高度自适应局部刷新
如果需要对画面中的部分区域作局部刷新，大家可能都会想到使用ajax。但有些情况下，须使用在页面中嵌入一个iframe来作局部刷新。对于使用iframe的情况，发现有一个问题，就是iframe中的页面的高度可能会很高，但是外面页面并不会被iframe内部页面给撑开，如下面的结构： <div id="content"> <div id=&quo
用Rapael做图表 tntxia rap
function drawReport(paper,attr,data){ var width = attr.width; var height = attr.height; var max = 0; &nbs
HTML5 bootstrap2网页兼容（支持IE10以下） xiaoluode html5 bootstrap
<!DOCTYPE html> <html> <head lang="zh-CN"> <meta charset="UTF-8"> <meta http-equiv="X-UA-Compatible" content="IE=edge">

【Unsupervised Image-to-Image Translation with Generative Prior 生成性先验引导的无监督的图像转换 (GPUNIT) 】 阅读笔记

一、背景

二、简介

三、相关工作

四、生成性的先验提取法

4.1 先验的跨域映射：

4.2 使用内容编码器进行事先提炼

一些概念:

L1范数、L2范数

五、基于对抗学习的图像转化

5.1 动态跳转链接

综合上述损失，我们的完整的目标：

类型采样：

六、实验结果

数据集：

在第一阶段，我们准备了合成数据和真实数据。

第二阶段，我们对四个翻译任务进行评估。

网络训练：

6.1 与最高水平技术的比较

定性比较

定量比较

6.2 消融实验（“控制变量法”地来查看每个部分起到的作用）

生成预提取

动态跳转连接

多层次的跨域对应

损失函数

6.3 更多结果

泛化到BigGAN以外的领域

看不见的视图合成

6.4 出现的问题

七、总结与讨论

你可能感兴趣的:(GAN,计算机视觉,深度学习,人工智能,GAN,生成对抗网络)

【Unsupervised Image-to-Image Translation with Generative Prior 生成性先验引导的无监督的图像转换 (GPUNIT) 】阅读笔记