啊菜来了

汉字风格迁移篇---W-net：基于深度神经网络的一次任意风格汉字生成

文章目录

一、摘要
二、提出原因
- 已有的一些模型解决方案
- - 依然存在的限制
三、介绍与创新
四、模型介绍
- 预处理
- w-net结构
- 优化策略和损失函数
五、实验
- 实验设置
- - 用zi2zi作为基线
  - 具体实现
  - - 1、 W-Net训练期间的超参数设置如下：
    - 2、一些细节处理
模型评估
- - - W-net、zi2zi-v1、zi2zi-v2不足与区别
失败案例分析
结论与未来工作
- 结论
- 未来工作
学习集合
References

一、摘要

由于类别数量巨大，各种笔画和部首的复杂组合，以及自由书写或印刷风格，生成具有多种风格的汉字一直被认为是一项艰巨的任务。
本文介绍了一种有效的、广义的深度框架，即W-Net，用于一次性任意风格汉字生成任务。

具体地，给定具有特定样式（例如，打印字体或手写样式）的单个字符（一次拍摄），所提出的W-Net模型能够学习和生成共享与给定单个字符类似的样式的任意字符。这种吸引人的财产在文献中很少见到。我们已经将所提出的W-Net框架与许多其他竞争方法进行了比较。实验结果表明，所提出的方法在单次拍摄设置中具有显著的优越性。

二、提出原因

汉语包含数千个不同的类别或10000多个不同的字符，其中3755个字符被定义为一级字符。给定有限数量的汉字或甚至一个具有特定风格的单个字符（例如，个性化手写书法或风格印刷字体），自动模仿具有相同特定风格的许多其他字符是很有趣的。
1、这一主题非常困难，很少研究，因为不同风格的不同汉字的类别数量很大。
2、由于汉字的独特性，这个问题更为棘手，其中每一个汉字都是各种笔画和部首的组合，具有不同的交互结构。

已有的一些模型解决方案

尽管存在这些挑战，但最近有一些与上述发电任务相关的建议。

1、在[13]中，笔画由时间序列表示，书写均匀的粗轨迹。然后将其发送到基于递归神经网络的生成器。
2、在[6]中，基于附加网络实现了用于标准化字符提取的字体特征重构，以辅助一对一图像到图像的翻译框架。在此框架中需要700多张预先选定的训练图像。
3、在Zi2Zi[12]模型中，通过基于固定高斯噪声的分类嵌入（每个样式有超过2000个训练示例），仅用单个模型实现了一对多映射。

依然存在的限制

上述方法存在几个主要限制。
1、这些方法的性能通常严重依赖于具有特定样式的大量样本。在几次或甚至一次生成的情况下，这些方法将无法奏效。
2、这些方法可能无法转变为训练中从未见过的新风格。因此，这些缺点可能导致它们无法实际使用。

三、介绍与创新

1、在本文中，为了在给定具有特定任意风格（在训练中可见或不可见）的单镜头样本时（用一个字生成一堆汉字）生成汉字，我们提出了一种新的深度模型W-Net作为广义风格转换框架。
2、该框架更好地解决了上述缺点，并且可以容易地在实践中使用。
3、特别地，对于一对一图像到图像翻译任务[4]，从U-Net框架[9]中固有的，所提出的W-Net使用两个并行的基于卷积的编码器来分别提取样式和内容信息。
4、生成的图像将由基于去卷积的解码器通过使用编码信息来获得。
5、设置捷径连接[9]和多个残差块[2]以处理梯度消失问题，并平衡从两个编码器到解码器的信息。
6、W-Net的培训遵循对抗性的方式。
7、受最近提出的具有梯度惩罚的Wasserstein生成对抗网络（W-GAN）框架[1]的启发，采用了独立的鉴别器1（D）来辅助W-Net（G）学习。
8、作为方法指南，本文仅演示了单镜头任意风格汉字生成，如图1所示。然而，W-Net框架可以扩展到单镜头任意样式图像生成的各种相关主题。
有了这样的建议，与文献中先前的方法相比，可以更容易和有效地完成具有较少样本的数据合成任务。

图1：通过提出的W-Net模型生成的传统字符，其中有一个样本可用（右下角的字符带有红色框）。

四、模型介绍

预处理

表示X是一个汉字数据集，由J个不同的字符组成，总共有I种不同的字体。设xij是X中的一个特定样本，被视为真正的目标。在[3，5]之后，上标i∈ [0，1，2，…，I]表示第I个样式，而下标j∈ [1，2，…，J]表示第J个示例。

具体而言，在训练期间，当i=0时，x0j表示具有标准化样式信息的第j个角色的图像，称为原型内容。同时，xik，k∈ [1，2，…，J]被定义为配备有与xij相同的第i个样式信息的样式参考。请注意，j和k通常不同。在所提出的模型中，假设每个xij与来自原型x0j和从xik学习的第i种写作风格的信息相结合。然后，所提出的W-Net模型将生成生成的目标G（x0j，xik），该目标G通过同时获取x0j和xik而与xij相似。

请注意，生成生成的目标只需要单个样式字符。它被定义为“单镜头任意样式字符生成”任务。具体地说，给定的单个样本（例如，xmp，其中m可以是任意样式，而p可以是任意单个字符。m和p可以分别与[1，2，…，I]和[1，2、…，J]无关）被视为一次性样式参考。在Encr的相关输出（如第2.2节所示，将通过快捷连接或剩余块连接连接到Dec）的条件下，通过提供所需第q个字符的任何内容原型（x0q）来生成G（x0q，xmp），即可轻松完成该任务。在这种设置中，交替q将导致合成不同的字符。同时，所有生成的示例都应该模仿xmp给出的第m个样式信息。同样，q也可以不在[1，2，…，J]中。

w-net结构

图2说明了所提出的W-Net模型的基本结构。它由内容原型编码器（Encp，蓝色部分）、样式参考编码器（Encr，绿色部分）和解码器（Dec，红色部分）组成。

图2：W-Net（更好地用颜色查看），其中蓝色部分表示Encp，绿色表示Encr，红色表示解码器 Conv: 5 × 5 卷积；DeConv:5×5反褶积。固定步幅2和ReLU应用于Conv和DeConv。ConCat：通道上的特征连接；ShortCut: Feature Shortcut;

1 、Encp和Encr被构造为卷积层序列，其中实现了具有固定步长2和ReLU函数的5×5滤波器。通过此设置，64×64原型图像x0j和参考图像xkj将被映射到1×512特征向量中，分别表示为Encp（x0j）和Encr（xkj）。
2、与U-Net框架[9]中的解码器相同，解码器dec被设计为与Encp和Encr明智连接的反进化进程层。它产生一个生成的图像，其大小与两个编码器的所有输入图像一致。具体而言，对于解码器和两个编码器之间的高级特征，通过简单的特征快捷方式实现连接。对于Encp的较低层，应用一系列残余块2[2]并将其连接到Dec。块的数量由超级参数M控制。
3、相反，由于写作风格是一种高级深度特征，Encr和Dec之间只有一个剩余的块连接（具有M个块），同时省略了低级特征连接。

优化策略和损失函数

所提出的W-Net基于被视为生成器G的Wasserstein生成对抗网络（W-GAN）框架进行对抗性训练。
1、具体而言，它采用内容原型和样式参考，然后将生成的目标返回为接近xij的G（x0j，xik）=Dec（Encp（x0j），Encr（xik））。G通过利用对抗网络D以及如下定义的若干优化损失来优化。

2、训练策略：W-Net的学习遵循对抗性训练策略。在每个学习迭代中，有两个独立的过程，分别包括G训练和D训练。训练G和D以分别优化方程（1）和方程（2）。

3、 对抗性损失： G优化Ladv−G=D（x0j，G（x0j、xik），xik）而D最小化Ladv−D=D（x0j，xij，xik）− D（x0j，G（x0j、xik），xik）。请注意，梯度惩罚设置为Ladv−糖蛋白=||∇bxD（x0j，bx，xik）− 1||2[1]，其中bx沿xij和G（x0j，xik）之间的线均匀插值。

4、鉴别器辅助分类器的类别丢失：

5、重建损失包括像素级差和高级特征变化 φ（.）表示特定的深度特征。这里使用了用多种字符样式训练的VGG-16网络[10]。在该优化中，共有五个卷积特征，包括φ1−2, φ2−2, φ3−3, φ4−3, φ5−涉及3个。

6、编码器的恒定损耗：两个编码器也采用恒定损耗[11]。它们由LConsp=||Encp（x0j）−Encp（G（x0j，xik））||2 和 LConstr=||Encr（xik）− Encr（G（x0j，xik））||2。分别用于Encp和Encr

7、两个编码器上的类别损失：为了确保两个编码器的特定功能，我们强制它们提取的内容和样式特征分别配备相同类型的相应通用性。通过添加完全连接来实现类别分类任务，这导致两个编码器都学习自己的代表性特征，同时避免了过度拟合。θp和θr分别用于表示编码器的两个输出特征向量的完全连接和softmax函数，而分类记为Cencp和Cencr。上述两种分类的交叉熵损失以Lenc−p−cls=[ log Cencp（j |θp（Encp（x0j））]和Lenc−p−cls=[ log Cencr（i|θr（Encr（xik））] 分别地请注意，i和j表示特定的样式和字符标签。

五、实验

一系列实验来验证所提出的W-Net网络的有效性。对打印字体和手写字体进行评估。还参考了几个相关的基线进行比较。

实验设置

数据集来源： 标准中文印刷字体数据库中专门选择了80种字体。其中50个，每个包含3755个一级简体中文字符，参与了训练集。

CASIA-HWDB-1.1（用于简化的孤立字符）和CASIA-HHDB-2.1（用于简体草书字符）[7]的脱机版本都是手写数据集。选择50位作家（编号1101至1150）书写的字符作为训练集，共产生249066个样本（平均每个作家4980个样本）。

对于这两组，测试数据的选择是出于不同的评估目的。HeiTi（黑体字体）被用作两组字体的原型字体，如图3（a）所示。

图3：生成的不可见打印和手写样式数据的几个示例。
（a）。输入内容原型；
（b） -（e）：第一行：生成的字符；第二行：对应的样式参考（基本真实字符）。

基线模型包括Zi2Zi[12]框架的两个升级版本，该框架经过了修改，用于少数镜头的新样式合成任务。

用zi2zi作为基线

Zi2Zi[12]框架的两个升级版本：
1、利用微调策略（记为Zi2Zi-V1），其中风格信息被假设为由基于固定高斯噪声的分类嵌入表示的多个已知风格的线性组合；
2、（Zi2Zi-V2）通过引入6个作者的最终softmax输出来丢弃分类嵌入，该输出是由于过度长度而被抑制的预训练VGG-16网络（嵌入器网络），与第2.3节中使用的网络相同。这些基线的所有其他网络架构和训练设置都是相同的[12]。

来自两个数据库的字符由64×64灰度图像表示，然后进行二值化。

需要特别注意的一点是，所提出的W-Net和Zi2Zi-V2都遵循一次性设置，在评估过程中仅引用单个样式示例（xmp）。
然而，Zi2Zi-V1采用了最少的（32个参考）方案，以获得有效的微调性能。

具体实现

1、 W-Net训练期间的超参数设置如下：

残差块数为M=5；相关惩罚为：α=3，αGP=10，βd=1，βp=βr=0.2，λl1=50，λφ=75，ψp=3，ψr=5。

2、一些细节处理

2.1 实现了具有β1=0.5和β2=0.999的Adam优化器，而初始学习率被设置为0.0005，并且在每个训练周期之后呈指数衰减。
2.2 D（鉴别器）的架构遵循Zi2Zi框架[12]与W-GAN框架的设置。
2.3 为了加快和稳定训练进度，将批处理归一化应用于G网络的多个层，而将层归一化应用于D。
2.4 还将丢弃技巧应用于G和D，以提高泛化性能。重量衰减也用于避免过度拟合问题。
2.5 拟议的W-Net框架和其他基线是用Tensorflow（r1.5）实现的。

模型评估

通过在本节中为内容x0q和样式xmp设置p=q来验证W-Net模型。
因此，引用正好是实际目标（xmp=xmq）。对于每个求值，如前所述，只使用单个样式引用（xmp，图3（b）-（e）中第二行的字符）。
如果所提出的W-Net能够重建参考图像xmp中所提取的风格信息，则所生成的图像被视为遵循单镜头参考的风格趋势。

图3举例说明了训练期间合成不可见风格的比较结果。
可以观察到，通过保持风格一致性，W-Net模型以适当的性能学习并将打印和手写类型的风格转移到原型。

图4：所见样式的生成字符的几个示例。
（a），（c）和（e）是打印字体；
（b）、（d）和（f）是手写体。
在每个图中，第一行：地面真实字符（带蓝色框）和单镜头样式参考（带红色框）；
第二：W-Net生成的字符；第三排：Zi2Zi-V1性能；第四排：Zi2Zi-V2性能。

W-Net的有效性通过生成具有替代样式的常用汉字（简体和繁体）来测试。
在此设置中，xmp是随机选择的具有第m个样式信息的单镜头角色，以模拟真实的应用场景，而q是指要生成的所需内容原型。通常，p 6=q。

图4和图5分别列出了WNet生成的图像的几个示例，以及训练期间可见和不可见风格的两个基线。

特别是，在培训过程中，只有简化的汉字可以使用，如这两幅插图中每个子图的左四列所示。在其他剩余栏目中，这些传统图像的两个相关数据库中都没有地面真相数据。

图5：生成的几种不可见样式的字符示例。
（a），（c）和（e）是打印字体；
（b）、（d）和（f）是手写体。在每个图中，第一行：地面真实字符（带蓝色框）和单镜头样式参考（带红色框）；第二：W-Net生成的字符；第三排：Zi2Zi-V1性能；第四排：Zi2Zi-V2性能。

当在训练期间生成具有特定可见样式的字符时，从图4中可以直观地观察到，即使给定单镜头样式参考，W-Net生成的字体看起来与相应的真实目标非常相似。

W-net、zi2zi-v1、zi2zi-v2不足与区别

不同的是，在少数镜头设置下，Zi2Zi-V1仍然会产生模糊的图像，而Zi2Zi-V2似乎会合成具有平均风格的人物。
所提出的W-Net通过产生具有所需内容和一致风格的角色而优于其他人，只有一个镜头风格参考可用。

同时，当使用一次性样式参考构建不可见样式时，通过所提出的方案仍然可以从图5中获得可接受的世代。虽然生成的样本与前面的示例中的样本不够相似，但仍然可以清楚地观察到明显的风格倾向。相比之下，Zi2Zi-V1未能生成高质量的图像，因为过度拟合问题，即使为微调提供了32个参考。同时，Zi2Zi-V2无法生成可区分的样式，因为它只能从嵌入器网络（VGG-16）提供的原始基础学习样式。

失败案例分析

1、当所提出的模型离原型字体太远时，它有时无法捕获样式信息。
例如，由于输入内容都是孤立的字符，一些草书书写可能在生成过程中起到负面作用。图6中给出了一些失败生成的字符，其中第二行列出了相应的一次性样式引用。

在提出的W-Net中，每个目标都被视为从参考到原型的非线性风格转换。
2、然而，当样式与内容字体差异太大时，模型无法学习这种复杂的映射关系。 在这种极端情况下，本文中提供的单一原型字体可能是不合适的选择。在这种情况下，学习其他映射可能是一个好主意，这些映射可以将原始原型转换为合适的潜在特征，以便更好地处理真实场景中的自由写作风格。

图6：不满意的生成示例。在每个图中：第一行：生成的字符；第二行：对应的样式参考（基本真实字符）

结论与未来工作

结论

1、介绍了一种新的通用框架W-Net，以实现一次任意风格汉字生成任务。
2、具体而言，所提出的模型由两个编码器和一个解码器组成，具有多个分层连接，基于W-GAN方案进行对抗性训练。
3、它能够通过将学习到的风格信息从单个引用传输到输入内容原型来合成任意的风格特征。
4、大量的实验证明了所提出的W-Net模型在一次拍摄设置中的合理性和有效性。

未来工作

未来将研究对图像重建更合适的映射架构的扩展，以捕捉足够复杂和自由的写作风格。同时，实际应用不仅局限于字符生成领域，而且还局限于其他相关的任意风格图像生成任务。

学习集合

References

Gulrajani, I., Ahmed, F., Arjovsky, M., Dumoulin, V., Courville, A.C.: Improved
training of wasserstein gans pp. 5769–5779 (2017)
He, K., Zhang, X., Ren, S., Sun, J.: Identity mappings in deep residual networks.
In: European Conference on Computer Vision. pp. 630–645. Springer (2016)
Huang, K., Jiang, H., Zhang, X.Y.: Field support vector machines. IEEE Transac-
tions on Emerging Topics in Computational Intelligence 1(6), 454–463 (2017)
Isola, P., Zhu, J.Y., Zhou, T., Efros, A.A.: Image-to-image translation with condi-
tional adversarial networks. arXiv preprint (2017)
Jiang, H., Huang, K., Zhang, R.: Field support vector regression. In: International
Conference on Neural Information Processing. pp. 699–708. Springer (2017)
Jiang, Y., Lian, Z., Tang, Y., Xiao, J.: Dcfont: an end-to-end deep chinese font
generation system. In: SIGGRAPH Asia 2017 Technical Briefs. p. 22. ACM (2017)
Liu, C.L., Yin, F., Wang, D.H., Wang, Q.F.: Casia online and offline chinese hand-
writing databases pp. 37–41 (2011)
Odena, A., Olah, C., Shlens, J.: Conditional image synthesis with auxiliary classifier
gans. arXiv preprint arXiv:1610.09585 (2016)
Ronneberger, O., Fischer, P., Brox, T.: U-net: Convolutional networks for biomedi-
cal image segmentation. In: International Conference on Medical image computing
and computer-assisted intervention. pp. 234–241. Springer (2015)
Simonyan, K., Zisserman, A.: Very deep convolutional networks for large-scale
image recognition. arXiv preprint arXiv:1409.1556 (2014)
Taigman, Y., Polyak, A., Wolf, L.: Unsupervised cross-domain image generation.
arXiv preprint arXiv:1611.02200 (2016)
Tian, Y.: zi2zi: Master chinese calligraphy with conditional adversarial networks.
https://github.com/kaonashi-tyc/zi2zi/ (2017)
Zhang, X.Y., Yin, F., Zhang, Y.M., Liu, C.L., Bengio, Y.: Drawing and recognizing
chinese characters with recurrent neural network. IEEE transactions on pattern
analysis and machine intelligence (2017)

【学习笔记5】Linux下cuda、cudnn、pytorch版本对应关系 longii11 linux pytorch 运维
一、cuda和cudnnNVIDIACUDAToolkit（CUDA）为创建高性能GPU加速应用程序提供了一个开发环境。借助CUDA工具包，您可以在GPU加速的嵌入式系统、桌面工作站、企业数据中心、基于云的平台和HPC超级计算机上开发、优化和部署您的应用程序。该工具包包括GPU加速库、调试和优化工具、C/C++编译器以及用于部署应用程序的运行时库。全球的深度学习研究人员和框架开发人员都依赖cuDN
【踩坑日记23】UserWarning: Plan failed with a cudnnException: CUDNN_BACKEND_EXECUTION_PLAN_DESCRIPTOR longii11 python 人工智能
问题描述/mnt/lab/XXX/anaconda3/envs/diffusion_ddpo/lib/python3.10/site-packages/torch/nn/modules/conv.py:456:UserWarning:PlanfailedwithacudnnException:CUDNN_BACKEND_EXECUTION_PLAN_DESCRIPTOR:cudnnFinalize
琴韵博主 —— 工具集琴韵知识库在线文档
CSDN猿如意_开发者工具箱CSDN开发助手ChromeChrome最新版离线下载internetdownloadmanager付费在线转换在线JSON字符串转Java实体类(JavaBean、Entity)在线MD5加密解密YAML、YML在线编辑器(格式化校验)在线图片转换成文字图片base64互转颜色转换颜色转换人民币大小写转换蛙蛙:英文字母大小写转换、文本工具汉字拼音在线转换Google翻
【Qt】Qt Widgets和QML（Qt Quick）开发界面的区别￡އއ昔年 qt 开发语言
Qt提供了两种主要的UI技术：QtWidgets和QML（QtQuick）。它们的核心区别主要体现在使用方式、架构、性能、开发难度和适用场景等方面。1.QtWidgetsvs.QML总体对比对比项QtWidgetsQML(QtQuick)语言C++(带QtUI库)QML+JavaScript(底层C++)渲染方式传统窗口系统控件（原生或模拟）基于OpenGL，使用GPU加速UI风格经典桌面UI（W
大语言模型对程序员行业的影响及未来发展走势分析 Hello kele 人工智能 java 人工智能 AI编程
随着人工智能技术的快速发展，特别是大语言模型（如DeepSeek、OpenAI、Grok等）的出现，对程序员这个行业产生了深远的影响。在这篇文章中，我们将探讨这些变化，分析影响，并展望未来的发展趋势。一、当前影响1.自动化代码生成大语言模型的一个直接影响是代码自动化的能力。这些模型可以理解代码上下文，并生成功能性代码。例如，GitHubCopilot已经成为许多开发者的辅助工具，能够根据注释或部分
DeepSeek：AI赋能的无限可能——从日常生活到职业进阶的全场景探索 Hello kele 人工智能人工智能
引言在人工智能技术飞速发展的今天，DeepSeek作为一款国产AI工具，凭借其强大的推理能力、自然语言处理效率和场景化应用潜力，正在重塑人类解决问题的方式。从撰写演讲稿到制定投资策略，从家庭教育到企业管理，DeepSeek通过“自然语言对话”的交互模式，将复杂任务简化为几步提示词的输入，真正实现了“所想即所得”。本文将从七大核心场景出发，系统解析DeepSeek如何成为个人与组织的智能助手，推动效
RAG 检索增强生成：技术详解与应用展望君君学姐 RAG检索增强生成
RAG检索增强生成：技术详解与应用展望一、引言随着人工智能技术的飞速发展，自然语言处理（NLP）领域迎来了前所未有的变革。其中，检索增强生成（Retrieval-AugmentedGeneration，简称RAG）作为一种新兴的技术框架，正逐渐成为大模型应用中的热门选择。RAG通过结合信息检索（IR）和自然语言生成（NLG）的能力，旨在提升模型在回答问题、生成文本等任务中的准确性和可靠性。本文将深
人工智能开发趋势光影少年人工智能
人工智能开发趋势：未来技术的演进与创新引言人工智能（AI）正在以惊人的速度发展，并在各行各业中发挥越来越重要的作用。从自然语言处理到计算机视觉，从自动化决策到自主学习，AI的发展方向正变得更加智能化、自动化和人性化。本文将探讨当前AI开发的最新趋势，并展望未来的发展方向。1.生成式AI的崛起近年来，生成式AI（如ChatGPT、StableDiffusion、DALL·E）展现出强大的内容创作能力
【系统架构设计师】以数据为中心的体系结构风格王佑辉系统架构设计师系统架构
目录1.说明2.仓库体系结构风格3.黑板体系结构风格1.说明1.以数据为中心的体系结构风格主要包括仓库体系结构风格和黑板体系结构风格。2.仓库体系结构风格1.仓库（Repository）是存储和维护数据的中心场所。2.在仓库风格中，有两种不同的构件：中央数据结构说明当前数据的状态以及一组对中央数据进行操作的独立构件，仓库与独立构件间的相互作用在系统中会有大的变化。3.这种风格的连接件即为仓库与独立
LLM辅助编程：代码自动生成与优化 AI智能涌现深度研究计算机软件编程原理与应用实践 DeepSeek R1 &大数据AI人工智能 java python javascript kotlin golang 架构人工智能
LLM,代码生成,代码优化,编程辅助,AI编程,自然语言处理,深度学习1.背景介绍随着软件开发的日益复杂化，程序员面临着越来越高的开发压力和效率要求。传统的编程方式依赖于手动编写代码，这不仅耗时费力，而且容易出现错误。近年来，随着深度学习技术的快速发展，基于大型语言模型（LLM）的代码生成和优化技术逐渐成为软件开发领域的新兴热点。LLM是一种强大的人工智能模型，能够理解和生成人类语言。通过训练大量
Oumi ：AI开发的未来？人工智能开源
Oumi：AI开发的未来？前言在人工智能领域，开源技术正以前所未有的速度推动着创新和变革。今天，我们将聚焦一个备受瞩目的开源AI平台——Oumi。它不仅以其强大的功能和灵活的架构吸引了全球开发者和企业的目光，还通过简化AI开发的整个生命周期，为用户提供了前所未有的便利。github地址：https://github.com/oumi-ai/oumi官网地址：https://oumi.ai/什么是O
DeepSeek独立部署对垂直行业影响力分析懂AI的老郑 DeepSeek应用 DeepSeek 智能体
Deepseek的本地部署通过定制化、数据隐私和智能体化，为传统行业带来深远变革。以下是对每个行业的详细应用场景扩展。1.教育深化应用场景场景1：个性化学习路径生成描述：根据学生的学习风格（视觉型、听觉型等）、薄弱科目和兴趣，生成定制化课程。实施：输入学生历史成绩和行为数据，微调Deepseek生成学习建议，集成到学校LMS。成果：学习效率提升20%，学生参与度提高30%。场景2：智能考试与评估描
关于采用源始经为底层框架开发中文编程系统的可能性太翌修仙笔录 deepseek 超算法认知架构第三代人工智能算法人工智能
用中文写代码和Python哪个有前景在编程语言选择方面，**Python的发展前景明显优于中文编程语言**。以下是具体分析：---###一、核心结论**优先选择Python**，因为：1.**全球通用性**：Python是国际主流编程语言，适用于跨国协作和开源项目2.**就业市场需求**：Python在人工智能/大数据/Web开发等领域的岗位需求持续增长3.**技术生态优势**：拥有超过30万个第
【免费收藏】清华大学DeepSeek使用手册合集 600页完整版周师姐 AI写作学习人工智能 pdf
DeepSeek资料链接：https://pan.quark.cn/s/c927326f70c5在人工智能席卷全球的当下，DeepSeek作为前沿深度学习技术，正推动着全面AI时代的到来。今日，特别为大家推荐《DeepSeek：从入门到精通》，本书由清华大学新闻与传播学院新媒体研究中心元宇宙文化实验室的余梦珑博士后团队精心编写。它深度解析DeepSeek的技术核心，详尽阐释其应用场景与操作方法，尤
CES Asia 2025：科技盛宴助力中国数字经济腾飞 CES_Asia 科技机器人人工智能智能音箱智能电视
备受瞩目的CESAsia2025第七届亚洲消费电子技术贸易展（赛逸展）将在首都北京盛大开幕。本届展会以“科技新视界，创新赢未来”为主题，聚焦人工智能、5G、物联网、元宇宙等前沿科技领域，集中展示全球消费电子行业的最新创新成果，为行业发展注入新动能。政策东风助力，CESAsia2025亮点纷呈近年来，中国高度重视数字经济发展，出台了一系列政策措施，为消费电子产业创造了良好的发展环境。CESAsia2
【真题笔记】09-12年系统架构设计师要点总结傻傻虎虎系统架构设计精编笔记系统架构
【真题笔记】09-12年系统架构设计师要点总结4+1视图UML4+1视图架构4+1视图场景DSSA（特定领域架构）从功能覆盖的范围角度理解DSSA中领域的含义集成系统数据库管理设计模式操作符运算符综合布线备份数据库集成工作流技术软件质量保证需求管理+需求开发结构化方法企业战略数据模型事务数据库+主题数据库系统设计原型开发静态分析架构风格+设计模式+软件架构设计软件架构评估SNMPV3软件开发集成机
芯科科技通过全新并发多协议SoC重新定义智能家居连接电子科技圈 Silicon Labs 智能家居边缘计算 mcu 物联网 iot 人工智能机器学习
MG26系列SoC现已全面供货，为开发人员提供最高性能和人工智能/机器学习功能致力于以安全、智能无线连接技术，建立更互联世界的全球领导厂商SiliconLabs（亦称“芯科科技”，NASDAQ：SLAB），日前宣布其MG26系列无线片上系统（SoC）现已通过芯科科技及其分销合作伙伴全面供货。作为业界迄今为止最先进、高性能的Matter和并发多协议解决方案，MG26SoC的闪存和RAM容量是芯科科技
【大模型系列篇】Vanna-ai基于检索增强(RAG)的sql生成框架木亦汐丫大模型语言模型 sql agi ai 数据库人工智能 embedding
简介Vanna是基于检索增强(RAG)的sql生成框架Vanna使用一种称为LLM（大型语言模型）的生成式人工智能。简而言之，这些模型是在大量数据（包括一堆在线可用的SQL查询）上进行训练的，并通过预测响应提示中最有可能的下一个单词或“标记”来工作。Vanna优化了提示（通过向量数据库使用嵌入搜索）并微调LLM模型以生成更好的SQL。Vanna可以使用和试验许多不同的LLM，以获得最准确的结果。V
中国人工智能大赛成果发布会 | 代码安全智能体让研发安全又高效安全
2024年12月20日，由厦门市人民政府主办，以“融新汇智竞促发展”为主题的第五届中国人工智能大赛成果发布会在厦门成功举办。人工智能安全论坛于成果发布会期间举办，重点聚焦人工智能安全技术专家，共同探讨安全治理的实践经验，探索智能体安全、大模型安全、数据安全、内容安全等方面面临的挑战和解决方案。百度安全技术委员会主席包沉浮受邀出席，分享了智能体技术在代码安全应用上的最新实践经验。百度安全技术委员会主
重磅发现！DeepSeek R1方法成功迁移到视觉领域，多模态AI迎来新突破！ zhangjiaofa DeepSeek R1&AI人工智能大模型人工智能 DeepSeek R1 多模态
一、引言在当今人工智能飞速发展的时代，多模态AI技术正逐渐成为研究与应用的焦点。近日，一项令人瞩目的成果引发了广泛关注——VLM-R1开源项目成功将DeepSeek的R1方法从纯文本领域迁移至视觉语言领域，为多模态AI的发展开辟了新的道路，极大地拓展了多模态领域的想象空间。本文将深入探讨这一创新性成果，从其灵感来源、验证结果、实际案例、带来的新思路以及开源资源等多个方面进行剖析，带您全面了解这一前
《从信息论视角：DataWorks平台下人工智能探寻最优数据编码的深度剖析》程序猿阿伟人工智能
在数字化时代，数据如汹涌浪潮般不断涌现，其规模之大、增长速度之快超乎想象。企业和组织每天都要面对海量数据的存储与传输挑战，如何在有限的资源条件下高效处理这些数据，成为亟待解决的关键问题。此时，信息论与人工智能算法为我们开辟了一条新的探索路径，尤其在DataWorks这样强大的大数据平台上，二者的结合蕴含着巨大的潜力。信息论，作为一门研究信息的度量、传输、存储和处理的学科，为理解数据的本质提供了深刻
《从信息论视角：DataWorks平台下人工智能探寻最优数据编码的深度剖析》人工智能深度学习
在数字化时代，数据如汹涌浪潮般不断涌现，其规模之大、增长速度之快超乎想象。企业和组织每天都要面对海量数据的存储与传输挑战，如何在有限的资源条件下高效处理这些数据，成为亟待解决的关键问题。此时，信息论与人工智能算法为我们开辟了一条新的探索路径，尤其在DataWorks这样强大的大数据平台上，二者的结合蕴含着巨大的潜力。信息论，作为一门研究信息的度量、传输、存储和处理的学科，为理解数据的本质提供了深刻
「AI」人工智能的发展阶段：ANI、AGI与ASI 何曾参静谧「AI」人工智能人工智能 agi
✨博客主页何曾参静谧的博客（✅关注、点赞、⭐收藏、转发）全部专栏（专栏会有变化，以最新发布为准）「Win」Windows程序设计「IDE」集成开发环境「定制」定制开发集合「C/C++」C/C++程序设计「DSA」数据结构与算法「UG/NX」NX二次开发「QT」QT5程序设计「File」数据文件格式「UG/NX」BlockUI集合「Py」Python程序设计「Math」探秘数学世界「PK」Paras
哈儿哥网络工作室 wodrpress资源分享独立站前端
哈儿哥网络工作室是一家专注于外贸网站搭建与海外品牌营销、网络营销推广的专业机构。凭借多年的行业经验和技术积累，我们致力于为客户提供全面的数字化营销解决方案，帮助企业顺利出海并提升国际竞争力。主要服务内容外贸网站搭建我们提供专业的外贸网站建设服务，包括独立站搭建、商城建设及定制化设计。采用WordPress等主流平台，结合H5自适应布局和欧美设计风格，确保网站界面美观、功能强大且加载速度快。此外，我
对深度学习中的基本概念—梯度的理解 Humingway 深度学习深度学习人工智能
本文讨论一下对“梯度”的理解。“梯度”是深度学习中基本又非常核心的概念，没有它就没有人工智能的今天。然而，即使抛开令人眼花缭乱的术语（比如sgd、ada、moment、adam）不谈，即使最简单的“梯度”本身，也值得讨论一下。1.提出问题该如何理解梯度？让我们结合具体的例子来体会一下。2.定义例子首先，我们定义一个简单的例子，来模拟一下深度学习的学习过程。已知：有一个正确的数据对（或者叫样本），(
网络安全就业形式怎么样？网络安全Ash web安全安全
点击文末小卡片，免费获取网络安全全套资料，资料在手，涨薪更快随着人工智能、物联网、5G等技术的普及，网络安全问题变得越来越复杂和多样化，因此企业越来越重视网络安全，政府也出台了相关政策支持网络安全建设，进一步推动了网络安全行业的发展，那么网络安全就业前景如何?这是大家关心的重点，我们来探讨一下。网络安全就业前景可以说是一片光明，是一个不错的行业。没有网络安全就没有国家安全，可想网络安全有多重要。而
11页PDF | DeepSeek平民化：AI助力数据治理整体方案（附下载） Leo.yuan 大数据人工智能
一、前言这份报告介绍了一种基于人工智能（AI）的智能数据治理整体方案，旨在通过AI的自然语言处理、学习能力、理解与推理能力等技术手段，解决传统数据治理中存在的问题，提升企业数据管理能力和效率。方案以高质量数据资产知识库为基础，结合智能化技术工具箱，针对数据治理中的痛点场景（如文档编写、元数据管理、数据标准、数据质量、数据安全、数据资产盘点等）提供智能化解决方案。通过AI技术的应用，方案能够实现数据
深度 | 车载语音群雄并起共争智能座舱新高地数据堂官方账号分享人工智能语音识别
不论是苹果公司iOS系统中的智能语言助手“Siri”，还是微软Windows系统中的“Cortana”，智能语音交互早已融入我们生活之中。随着汽车产业的发展，用户消费形态的改变，自动驾驶、智能座舱、新能源这些概念已经逐渐落地成为现实，智能语音交互与汽车之间也擦出了别样的火花。由于驾驶汽车无法解放双手，对于人机互动的需求，则更多需要通过语言来实现。因此，结合了人工智能的车载语音交互系统作为汽车智能网
Trae国内版发布，中国首款AI 原生IDE 正式上线，配置Doubao-1.5-pro，支持切换满血版DeepSeek 模型荣华富贵8 程序员的知识储备1 程序员的知识储备2 程序员的知识储备3 人工智能 ide
标题：Trae国内版发布：开启AI原生IDE的全新时代正文：在当今软件开发领域，人工智能正在逐渐改变开发者的日常工作方式。作为中国首款真正从底层深度融合AI技术的原生IDE（集成开发环境），Trae国内版正式上线，成为国内开发工具领域的里程碑式创新。这一产品不仅标志着中国开发者生态的智能化迈出关键一步，更通过其先进的技术和灵活的AI模型支持，为开发者提供了全新的编程体验。什么是AI原生IDE？为什
AI数字平权大囚长科普天地机器学习人工智能
AIAgent（人工智能智能体）正在通过技术平权和服务场景延伸，显著扩展普通人的能力范围边界。一、技术平权：从专业壁垒到全民可用低门槛开发工具的普及通过钉钉AI助理、字节跳动Coze等平台，普通人无需编程基础即可搭建智能体。例如，钉钉AI助理市场允许用户直接调用通义千问等大模型，创建标准化的工作流（如自动整理会议纪要、生成竞品分析报告）；Coze平台支持DeepSeek等低成本模型，用户可通过“3
枚举的构造函数中抛出异常会怎样 bylijinnan java enum 单例
首先从使用enum实现单例说起。为什么要用enum来实现单例？这篇文章（ http://javarevisited.blogspot.sg/2012/07/why-enum-singleton-are-better-in-java.html）阐述了三个理由： 1.enum单例简单、容易，只需几行代码： public enum Singleton { INSTANCE;
CMake 教程 aigo C++
转自：http://xiang.lf.blog.163.com/blog/static/127733322201481114456136/ CMake是一个跨平台的程序构建工具，比如起自己编写Makefile方便很多。介绍：http://baike.baidu.com/view/1126160.htm 本文件不介绍CMake的基本语法，下面是篇不错的入门教程： http:
cvc-complex-type.2.3: Element 'beans' cannot have character Cb123456 spring Webgis
cvc-complex-type.2.3: Element 'beans' cannot have character Line 33 in XML document from ServletContext resource [/WEB-INF/backend-servlet.xml] is i
jquery实例:随页面滚动条滚动而自动加载内容 120153216 jquery
<script language="javascript"> $(function (){ var i = 4;$(window).bind("scroll", function (event){ //滚动条到网页头部的高度，兼容ie,ff,chrome var top = document.documentElement.s
将数据库中的数据转换成dbs文件何必如此 sql dbs
旗正规则引擎通过数据库配置器（DataBuilder）来管理数据库，无论是Oracle，还是其他主流的数据都支持，操作方式是一样的。旗正规则引擎的数据库配置器是用于编辑数据库结构信息以及管理数据库表数据，并且可以执行SQL 语句，主要功能如下。 1)数据库生成表结构信息：主要生成数据库配置文件(.conf文
在IBATIS中配置SQL语句的IN方式 357029540 ibatis
在使用IBATIS进行SQL语句配置查询时，我们一定会遇到通过IN查询的地方，在使用IN查询时我们可以有两种方式进行配置参数：String和List。具体使用方式如下： 1.String:定义一个String的参数userIds，把这个参数传入IBATIS的sql配置文件，sql语句就可以这样写： <select id="getForms" param
Spring3 MVC 笔记（一） 7454103 spring mvc bean REST JSF
自从 MVC 这个概念提出来之后 struts1.X struts2.X jsf 。。。。。这个view 层的技术一个接一个！都用过！不敢说哪个绝对的强悍！要看业务，和整体的设计！最近公司要求开发个新系统！
Timer与Spring Quartz 定时执行程序 darkranger spring bean 工作 quartz
有时候需要定时触发某一项任务。其实在jdk1.3，java sdk就通过java.util.Timer提供相应的功能。一个简单的例子说明如何使用，很简单： 1、第一步，我们需要建立一项任务，我们的任务需要继承java.util.TimerTask package com.test; import java.text.SimpleDateFormat; import java.util.Date;
大端小端转换，le32_to_cpu 和cpu_to_le32 aijuans C语言相关
大端小端转换，le32_to_cpu 和cpu_to_le32 字节序 http://oss.org.cn/kernel-book/ldd3/ch11s04.html 小心不要假设字节序. PC 存储多字节值是低字节为先(小端为先, 因此是小端), 一些高级的平台以另一种方式(大端)
Nginx负载均衡配置实例详解 avords
[导读] 负载均衡是我们大流量网站要做的一个东西，下面我来给大家介绍在Nginx服务器上进行负载均衡配置方法，希望对有需要的同学有所帮助哦。负载均衡先来简单了解一下什么是负载均衡，单从字面上的意思来理解就可以解负载均衡是我们大流量网站要做的一个东西，下面我来给大家介绍在Nginx服务器上进行负载均衡配置方法，希望对有需要的同学有所帮助哦。负载均衡先来简单了解一下什么是负载均衡
乱说的 houxinyou 框架敏捷开发软件测试
从很久以前，大家就研究框架，开发方法，软件工程，好多！反正我是搞不明白！这两天看好多人研究敏捷模型，瀑布模型！也没太搞明白. 不过感觉和程序开发语言差不多，瀑布就是顺序，敏捷就是循环. 瀑布就是需求、分析、设计、编码、测试一步一步走下来。而敏捷就是按摸块或者说迭代做个循环，第个循环中也一样是需求、分析、设计、编码、测试一步一步走下来。也可以把软件开发理
欣赏的价值——一个小故事 bijian1013 有效辅导欣赏欣赏的价值
　　第一次参加家长会，幼儿园的老师说："您的儿子有多动症，在板凳上连三分钟都坐不了，你最好带他去医院看一看。"　　回家的路上，儿子问她老师都说了些什么，她鼻子一酸，差点流下泪来。因为全班30位小朋友，惟有他表现最差；惟有对他，老师表现出不屑，然而她还在告诉她的儿子："老师表扬你了，说宝宝原来在板凳上坐不了一分钟，现在能坐三分钟。其他妈妈都非常羡慕妈妈，因为全班只有宝宝
包冲突问题的解决方法 bingyingao eclipse maven exclusions 包冲突
包冲突是开发过程中很常见的问题：其表现有： 1.明明在eclipse中能够索引到某个类，运行时却报出找不到类。 2.明明在eclipse中能够索引到某个类的方法，运行时却报出找不到方法。 3.类及方法都有，以正确编译成了.class文件，在本机跑的好好的，发到测试或者正式环境就抛如下异常： java.lang.NoClassDefFoundError: Could not in
【Spark七十五】Spark Streaming整合Flume-NG三之接入log4j bit1129 Stream
先来一段废话：实际工作中，业务系统的日志基本上是使用Log4j写入到日志文件中的，问题的关键之处在于业务日志的格式混乱，这给对日志文件中的日志进行统计分析带来了极大的困难，或者说，基本上无法进行分析，每个人写日志的习惯不同，导致日志行的格式五花八门，最后只能通过grep来查找特定的关键词缩小范围，但是在集群环境下，每个机器去grep一遍，分析一遍，这个效率如何可想之二，大好光阴都浪费在这上面了
sudoku solver in Haskell bookjovi sudoku haskell
这几天没太多的事做，想着用函数式语言来写点实用的程序，像fib和prime之类的就不想提了（就一行代码的事），写什么程序呢？在网上闲逛时发现sudoku游戏，sudoku十几年前就知道了，学生生涯时也想过用C/Java来实现个智能求解，但到最后往往没写成，主要是用C/Java写的话会很麻烦。现在写程序，本人总是有一种思维惯性，总是想把程序写的更紧凑，更精致，代码行数最少，所以现
java apache ftpClient bro_feng java
最近使用apache的ftpclient插件实现ftp下载，遇见几个问题，做如下总结。 1. 上传阻塞，一连串的上传，其中一个就阻塞了，或是用storeFile上传时返回false。查了点资料，说是FTP有主动模式和被动模式。将传出模式修改为被动模式ftp.enterLocalPassiveMode();然后就好了。看了网上相关介绍，对主动模式和被动模式区别还是比较的模糊，不太了解被动模
读《研磨设计模式》-代码笔记-工厂方法模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * 工厂方法模式：使一个类的实例化延迟到子类 * 某次，我在工作不知不觉中就用到了工厂方法模式（称为模板方法模式更恰当。2012-10-29）： * 有很多不同的产品，它
面试记录语 chenyu19891124 招聘
或许真的在一个平台上成长成什么样，都必须靠自己去努力。有了好的平台让自己展示，就该好好努力。今天是自己单独一次去面试别人，感觉有点小紧张，说话有点打结。在面试完后写面试情况表，下笔真的好难，尤其是要对面试人的情况说明真的好难。今天面试的是自己同事的同事，现在的这个同事要离职了，介绍了我现在这位同事以前的同事来面试。今天这位求职者面试的是配置管理，期初看了简历觉得应该很适合做配置管理，但是今天面
Fire Workflow 1.0正式版终于发布了 comsci 工作 workflow Google
Fire Workflow 是国内另外一款开源工作流，作者是著名的非也同志，哈哈.... 官方网站是 http://www.fireflow.org 经过大家努力,Fire Workflow 1.0正式版终于发布了正式版主要变化: 1、增加IWorkItem.jumpToEx(...)方法，取消了当前环节和目标环节必须在同一条执行线的限制，使得自由流更加自由 2、增加IT
Python向脚本传参 daizj python 脚本传参
如果想对python脚本传参数，python中对应的argc, argv(c语言的命令行参数)是什么呢？需要模块：sys 参数个数：len(sys.argv) 脚本名： sys.argv[0] 参数1： sys.argv[1] 参数2： sys.argv[
管理用户分组的命令gpasswd dongwei_6688 passwd
NAME： gpasswd - administer the /etc/group file SYNOPSIS： gpasswd group gpasswd -a user group gpasswd -d user group gpasswd -R group gpasswd -r group gpasswd [-A user,...] [-M user,...] g
郝斌老师数据结构课程笔记 dcj3sjt126com 数据结构与算法
<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<
yii2 cgridview加上选择框进行操作 dcj3sjt126com GridView
页面代码 <?=Html::beginForm(['controller/bulk'],'post');?> <?=Html::dropDownList('action','',[''=>'Mark selected as: ','c'=>'Confirmed','nc'=>'No Confirmed'],['class'=>'dropdown',])
linux mysql fypop linux
enquiry mysql version in centos linux yum list installed | grep mysql yum -y remove mysql-libs.x86_64 enquiry mysql version in yum repositoryyum list | grep mysql oryum -y list mysql* install mysq
Scramble String hcx2013 String
Given a string s1, we may represent it as a binary tree by partitioning it to two non-empty substrings recursively. Below is one possible representation of s1 = "great":
跟我学Shiro目录贴 jinnianshilongnian 跟我学shiro
历经三个月左右时间，《跟我学Shiro》系列教程已经完结，暂时没有需要补充的内容，因此生成PDF版供大家下载。最近项目比较紧，没有时间解答一些疑问，暂时无法回复一些问题，很抱歉，不过可以加群（334194438/348194195）一起讨论问题。 ----广告-----------------------------------------------------
nginx日志切割并使用flume-ng收集日志 liyonghui160com
nginx的日志文件没有rotate功能。如果你不处理，日志文件将变得越来越大，还好我们可以写一个nginx日志切割脚本来自动切割日志文件。第一步就是重命名日志文件，不用担心重命名后nginx找不到日志文件而丢失日志。在你未重新打开原名字的日志文件前，nginx还是会向你重命名的文件写日志，linux是靠文件描述符而不是文件名定位文件。第二步向nginx主
Oracle死锁解决方法 pda158 oracle
　select p.spid,c.object_name,b.session_id,b.oracle_username,b.os_user_name from v$process p,v$session a, v$locked_object b,all_objects c where p.addr=a.paddr and a.process=b.process and c.object_id=b.
java之List排序 shiguanghui list排序
在Java Collection Framework中定义的List实现有Vector，ArrayList和LinkedList。这些集合提供了对对象组的索引访问。他们提供了元素的添加与删除支持。然而，它们并没有内置的元素排序支持。　　你能够使用java.util.Collections类中的sort()方法对List元素进行排序。你既可以给方法传递
servlet单例多线程 utopialxw 单例多线程 servlet
转自http://www.cnblogs.com/yjhrem/articles/3160864.html 和 http://blog.chinaunix.net/uid-7374279-id-3687149.html Servlet 单例多线程 Servlet如何处理多个请求访问？Servlet容器默认是采用单实例多线程的方式处理多个请求的：1.当web服务器启动的