niaoma

Deepfacelab 训练参数详解，从入门到精通。值得收藏

导言
训练时有许多参数，对不懂机器学习的萌新来说简直就是天书
本篇教程就带大家揭开训练时各参数的含义与效果，同时给出建议数值

我尽量用通俗易懂的语言来解释每一条参数的作用，不需要机器学习基础也能看懂。本文主讲SAEHD模型的训练脚本，QUICK96类似，不重复展开

先分享一下好东西，请珍藏。

deepfacelab常用工具合集，小白变高手
下载地址：
链接：https://pan.baidu.com/s/12WB7odewviDhDoDQtVXFgQ?pwd=w8pj
提取码：w8pj
--来自百度网盘超级会员V2的分享

-----------------------------------------------------------------------------------------------------------------

金收购的十三个deepfacelab模型，大大小小的都有，总有一个适合你的（预训练模型）
下载地址：
链接：https://pan.baidu.com/s/10lX1TApav3jAA4EOThxjCA?pwd=sr8a
提取码：sr8a
--来自百度网盘超级会员V1的分享

-----------------------------------------------------------------------------------------------------------------

花几千米收来的多个deepfacelab模型（模型+遮罩+说明）（模型）
下载地址：
链接：https://pan.baidu.com/s/1Xes3VlY2jSCHmYEl3Qoo3A?pwd=xlet
提取码：xlet
--来自百度网盘超级会员V2的分享

下面以2021年0104英文版为案例讲解，附带中文翻译。
可能跟各汉化版名称说法有出入，请自行对照阅读

0. 什么是参数？

参数是控制模型结构与模型训练方法的一些值

所有参数中，有些参数只在第一次创建模型时可调整，一旦确定后不可更改。有些参数可以在后续训练中随时调整。

就好比造大厦，一旦决定造几层楼，每层有几间房间，就不可再次变更。而清洁工、保安可以随时雇佣或开除

1. 怎么输入/调节参数？

第一次运行时，会让你输入各个参数值，输入方法如下：

[0] Which GPU indexes to choose? :请输入GPU序号

问句前的[0]表示你直接按回车后，会使用的默认值你可以自行输入值，值的可选项通常在问句中会给出
如果不了解这个选项的作用，输入英文问号？按回车，会给出详细说明

当模型创建后，第N次执行训练脚本时，选择好模型和GPU后，短暂停顿后会有一行提示“Press enter in 2 seconds to override model settings”“请在2秒内按enter回车以重新修改模型参数设置”就是字面意思。如果2秒内没按enter，就会沿用上一次训练时的参数进行训练

接下来就解释各参数的作用，带*的一旦创建不可更改

1. 选择/创建模型

Choose one of saved models, or enter a name to create a new model.选择一个已有的模型，或输入名字创建新模型
[r] : rename
[d] : delete

[0] : liaef-ud512 - latest
:

介绍：如果model文件夹内已经有模型，在这里会显示出来，如上图的[0] : liaef-ud512 - latest如果沿用已存在的模型，输入模型前的编号。如果要新建模型，直接输入名字后按回车。

2. 选择训练用GPU

Choose one or several GPU idxs (separated by comma).选择一个或多个GPU序号，用英文逗号隔开
[CPU] : CPU
[0] : GeForce RTX 3090

[0] Which GPU indexes to choose? :请输入GPU序号

介绍：第一次运行时首先会出现上面这段文字。要求你输入用于训练模型的GPU序号。可支持的序号已经给你列出来了，输入CPU就使用CPU训练，输入0就使用你的第一张显卡训练。土豪有多张显卡的话输入0,1,2,3.....
问句前面的[0]代表默认值，即直接按回车会采用的值
推荐值：推荐只用编号为0的GPU训练。CPU速度太慢，直接放弃。有多张GPU的话，卡间通讯会消耗大量时间，如无必要不推荐多卡同时训练。

3. 选择自动备份时间

[0] Autobackup every N hour每N小时备份 ( 0..24 ?:help ) :

介绍：自动备份会每隔N小时复制一份模型文件，以免模型崩溃后没法回退。0表示不自动备份
推荐值：6-12

3. 记录保存预览图

[n] Write preview history ( y/n ?:help ) :

介绍：每次迭代会保存一张当前训练效果图，方便你查看模型进步效果，来判断是否已经训练到顶峰了。图片保存在model内一个以history结尾的文件夹中
推荐值：n 一般人看预览窗口的图就OK了。这个功能给做专业对比测试的用

4. 指定预览图

[n] Choose image for the preview history ( y/n ) :

介绍：指定一张图片作为保存的历史预览图。选n就随机选一张
推荐值：n

5. 目标迭代次数

[0] Target iteration目标迭代数 :

介绍：模型训练迭代次数，到了这个次数就停止训练。选0就一直会训练下去，直到你手动停止
推荐值：0

6. 随机翻转人脸

[y] Flip faces randomly ( y/n ?:help ) :

介绍：图片随机左右翻转，以增多数据。src图不足时可以开，但更好的方式是增加数据。如果遇到src人脸左右不对称，比如一边有痣，一边没痣，那么开启后会导致练出来的人脸两边都会有若隐若现的痣。不推荐开，增加数据集是王道
推荐值：n

7.批尺寸大小

[2] Batch_size ( ?:help ) : ?

介绍：每次迭代程序会随机选batchsize张图来学习，数量越大模型每次进步的方向越准，单次迭代时间也越久，需要的显存也相应成倍增加
推荐值：4-16 通常显存不足报错后，把这个值改低就好

8. 模型分辨率*

[512] Resolution ( 64-640 ?:help ) : ?

介绍：模型生成人脸的分辨率。注意，这个只是尺寸大，并不是更清晰。大尺寸的结果就是训练速度更慢，通常256足够用了。一般人连256都训练不到高清，完全没必要用256以上的分辨率模型。
推荐值：128-256，要是16的倍数

9. 选择人脸类型*

[wf] Face type人脸类型 ( h/mf/f/wf/head ?:help ) :

介绍：训练用的人脸类型。什么是人脸类型呢，就是从原图中截取的人脸框大小。h是half face，mf是mid-half-face，f是full-face，wf是whole-face，head是最大的带整个头的人脸。光说没用，上图看对比
f/mf/h的对比如下：

wf的范围如下

人脸越大，最后合成环节的可调节余地越大。但相同模型分辨率下，有效面积就越小。比如256尺寸的wf，有效的人脸范围大概只有二分之一大。但在显存越来越大的今天，不用担心。
h是3年前deepfake刚问世时的人脸类型，当年显存小啊，只能将就将就。
推荐值：推荐用wf，已经把整个脸都包含进了，而且能兼容f人脸素材。 h和mf太小，在后期合成时没调整余地。head过大，没必要浪费显存。
许多人总问head模型，真没必要。我理解你们是觉得head可以把脸型也生成出来，这个wf就行，但实际上合成时用的还是dst的人脸轮廓，你训练阶段能生成没卵用。脸型问题你就认为无解吧，只能靠专业后期调整，别再向我追问head模型了。

10. 模型的架构*

[liae-ud] AE architecture ( ?:help ) : ?
'df' keeps more identity-preserved face.
'liae' can fix overly different face shapes.
'-u' increased likeness of the face.
'-d' (experimental) doubling the resolution using the same computation cost.
Examples: df, liae, df-d, df-ud, liae-ud, ...

介绍：模型的核心架构类型。有DF和LIAE两种架构。内容较多，具体区别细节以后单独开教程。这里你只要记住结论DF五官结构保留的更像，LIAE光影处理的更好。
除了核心架构外，还有几个附带参数可加，-u增加人脸相似度，-d在相同显存占用量下，牺牲速度换取分辨率.
核心架构和附带参数可组合使用，如 df, liae, df-d, df-ud, liae-ud
推荐值：LIAE系列

11. 模型中间瓶颈层的宽度

[256] AutoEncoder dimensions ( 32-1024 ?:help ) :

介绍：模型最中间一层神经元的数量。可以理解为越大这个模型能力越强，但要求的显存也越大。就像大脑，人脑比猪脑神经元更多，能力也越强，但需要的头骨容量也越大。
推荐值：256及以上

12. 模型编码层的宽度

[64] Encoder dimensions ( 16-256 ?:help ) :

介绍：模型前半部分神经元的数量。可以理解为越大这个模型能力越强，但要求的显存也越大。就像大脑，人脑比猪脑神经元更多，能力也越强，但需要的头骨容量也越大。
推荐值：64及以上

13. 模型解码层的宽度

[64] Encoder dimensions ( 16-256 ?:help ) :

介绍：模型后半部分神经元的数量。可以理解为越大这个模型能力越强，但要求的显存也越大。就像大脑，人脑比猪脑神经元更多，能力也越强，但需要的头骨容量也越大。
推荐值：64及以上

14. 模型解码器遮罩层宽度

[16] Decoder mask dimensions ( 16-256 ?:help ) : ?
Typical mask dimensions = decoder dimensions / 3. If you manually cut out obstacles from the dst mask, you can increase this parameter to achieve better quality.

介绍：模型中有个分支是学习遮罩，次此参数控制此部分的宽度。
推荐值：三分之一解码层宽度

15. 只训练遮罩部分

[n] Masked training ( y/n ?:help ) : ?
This option is available only for 'whole_face' or 'head' type. Masked training clips training area to full_face mask or XSeg mask, thus network will train the faces properly.

介绍：只有人脸类型是wf或head时可选。开启后模型只关注于被遮罩划分出来的人脸，不学习遮罩外的无关区域。这个遮罩需要提前用Xseg模型应用得到。不然默认使用人脸关键点围合而成的遮罩，会把头发等其他区域给囊括进来。
推荐值：y

16. 眼部嘴部优先训练

[n] Eyes and mouth priority ( y/n ?:help ) :

介绍：眼神和嘴巴口型是最难训练的区域，开启这个参数可以让模型重点优化眼部和嘴部。但如果你没有闭眼素材和张嘴素材，开这个参数也没用
推荐值：n

17. 均匀化样本中各角度的素材

[n] Uniform yaw distribution of samples ( y/n ?:help ) : ?
Helps to fix blurry side faces due to small amount of them in the faceset.

介绍：一般样本中正脸图片居多，俯仰脸侧脸数量较少，这会导致纯随机选取样本时，这些大角度素材被选中训练的概率较小，模型对它们的学习不足。开启此参数后，会根据人脸角度来挑选素材，让大角度人脸样本得到较好的训练
推荐值：n 看你的目标视频，如果有很多大角度的话，建议开启

18. 记录保存预览图

[n] Write preview history ( y/n ?:help ) :

介绍：每次迭代会保存一张当前训练效果图，方便你查看模型进步效果，来判断是否已经训练到顶峰了。图片保存在model内一个以history结尾的文件夹中
推荐值：n 一般人看预览窗口的图就OK了。这个功能给做专业对比测试的用

19. 把模型和优化器放到GPU中使用

[y] Place models and optimizer on GPU ( y/n ?:help ) : ?

介绍：开启后模型权重会放在GPU上使用，减少GPU和内存通信，从而提高训练速度。显存足够就开启，显存不够就关闭
推荐值：y

20. 使用AdaBelief优化器

[y] Use AdaBelief optimizer? ( y/n ?:help ) : ?

介绍：使用最新的adabelief优化器作为训练用的迭代方法。模型收敛到最优状态的速度更快，效果更好。但会占用更多显存
推荐值：y

21. 使用学习率衰减

[n] Use learning rate dropout ( n/y/cpu ?:help ) :

介绍：学习率可以简单理解每次模型进化的步子大小。步子大了容易扯着蛋，走上歧途。步子小了可以更精准走到正确的地点，但速度就慢。
推荐值：前期不开，等你感觉画面很久没进步时开启。

22. 是否扭曲样本

[y] Enable random warp of samples ( y/n ?:help ) :

介绍：开扭曲后，给模型增大学习难度，让模型得到更高难度的锻炼，学成后就更牛逼。不开的话容易src和dst互相影响，让生成的src像dst。
推荐值：y 前期开，后期可关闭

23. GAN（生成对抗学习）的强度

[0.0] GAN power ( 0.0 .. 1.0 ?:help ) :

介绍：机器学习中有个很牛逼的算法叫GAN，能生成细节更丰富的图，眼睫毛都根根分明。但特别耗显存，高配玩家建议开启。开启后模型崩溃的概率会增大，一定要做好自动备份。
推荐值：低配0 高配0.1

24. GAN的感知域尺寸大小*

[24] GAN patch size ( 3-640 ?:help ) :

介绍：GAN每次去辨别的区域大小，越大效果越好，显存也占用越多。
推荐值：分辨率/8

25. GAN的模型宽度*

[0.0] GAN dimensions(4-512 ?:help):

介绍：类似模型编码层宽度，越大效果越好，显存也占用越多。
推荐值：16 显存大可酌情增加

26. 脸部明暗色彩学习强度

[0.0] Face style power ( 0.0..100.0 ?:help ) : ?

介绍：让生成的人脸和原本的人脸在明暗色彩上更相似。
推荐值：初期不开，后期从0.001开始慢慢增加，不要开太大，0.01差不多了，这个很容易崩

27. 背景明暗色彩学习强度

[0.0] Background style power ( 0.0..100.0 ?:help ) : ?

介绍：让生成的背景和原本的背景在明暗色彩上更相似。学背景干嘛，后面都是要扣掉的，没必要，不用开
推荐值：0

28. 对src做变色处理

[none] Color transfer for src faceset ( none/rct/lct/mkl/idt/sot ?:help ) :

介绍：src素材通常光影不够丰富，开启这个参数后，可以每次对src素材做随机颜色变化，人为营造出各种光影色彩
推荐值：rct或lct

29. 使用梯度剪裁

[n] Enable gradient clipping ( y/n ?:help ) :

介绍：梯度是什么，可以理解为每次模型更新的变化剧烈程度。开启此参数后，会把模型剧烈的变化给限制住，能极大避免模型崩溃。不然很可能遇到一次很奇怪的数据，导致模型瞬间爆炸，崩成一片纯色
推荐值：y 强烈建议开着，不会多消耗显存

30. 使用预训练模式

[n] Enable pretraining mode ( y/n ?:help ) :

介绍：一体包软件在 _internal\pretrain_CelebA\faceset.pak 放了一份综合名人人脸数据，人种、光影、角度很丰富，开启此参数后，src和dst就会使用这份数据做为训练。让模型可以先做个通识教育。为你自己的特定数据学习打下良好基础。
推荐值：n 我个人不推荐用这种方式做预训练。个人推荐你把杂七杂八的图直接放到src的aligned和dst的aligned文件夹中训练就行，效果一模一样，还方便随时增删数据。

最后给一套通用训练方式

强烈建议萌新用别人已经训练过的模型作为开始，可以节省大量时间

先开这组参数训练10-60W
face type : WF
random_flip : off
adabelief : on
eyes_mouth_prio : on
ct_mode: lct .

再开这个训练10-30W
learning rate drop：y

再关闭随机扭曲训练10-30W
random warp：n

最后开GAN训练10-30W
GAN poewer： 0.1

计算机视觉毕业设计选题推荐：选题技巧建议收藏 HaiLang_IT 毕业设计人工智能计算机视觉
目录前言毕设选题开题指导建议更多精选选题选题帮助最后前言大家好,这里是海浪学长毕设专题!大四是整个大学期间最忙碌的时光，一边要忙着准备考研、考公、考教资或者实习为毕业后面临的升学就业做准备,一边要为毕业设计耗费大量精力。学长给大家整理了人工智能专业最新精选选题，如遇选题困难或选题有任何疑问，都可以问学长哦(见文末)!对毕设有任何疑问都可以问学长哦!更多选题指导:最新最全计算机专业毕设选题精选推荐汇
「Python数据分析」Pandas基础，筛选数据利器：布尔索引奕澄羽邦 python 数据分析 pandas
我们在处理数据的时候，数据筛选是一个重要的过程。利用布尔索引，我们可以选择需要的数据区间。布尔索引，是利用各种不等式，以及与或非操作，来对数据区间进行选择。在pandas中，与操作，对应的是&这个符号，表示选取两个数据集重合的部分。或操作，对应的是|这个符号，表示选择两个数据集中，只要在一个数据集中出现的部分。非操作，对应的是~这个符号，表示选取一个数据集中，相反的部分。我们下面通过具体的例子，来
【数学建模】灰色关联分析模型详解与应用烟锁池塘柳0 数学建模数学建模算法
灰色关联分析模型详解与应用文章目录灰色关联分析模型详解与应用引言灰色系统理论简介灰色关联分析基本原理灰色关联分析计算步骤1.确定分析序列2.数据无量纲化处理3.计算关联系数4.计算关联度灰色关联分析应用实例实例：某企业生产效率影响因素分析灰色关联分析在各领域的应用灰色关联分析的Python实现灰色关联分析的局限性结论引言在数据分析领域，我们经常面临样本量少、信息不完全、数据不确定性高的情况。传统的
数据分析_python进行数据筛选1_行筛选 Monkey*王 python 数据分析 pandas
以titanic的训练数据为例进行展示，为了简化取前十行为例首先导入模块，导入数据importpandasaspdimportnumpyasnpdf=pd.read_csv(r"C:\Users\admin\Desktop\train.csv")df=df.head(10)df.index=['a','b','c','d','e','f','g','h','i','g']筛选单行1.利用df[行索
Python的那些事第四十六篇：基于属性的测试库hypothesis研究暮雨哀尘 Python的那些事 python 开发语言属性测试库 hypothesis 执行流程构建
一、引言（一）研究背景随着软件系统复杂性的不断增加，软件测试在确保软件质量方面的重要性愈发凸显。传统测试方法在面对大规模、复杂软件系统时，往往存在测试用例设计不全面、测试执行效率低下等问题。基于属性的测试作为一种新兴的测试方法，通过定义软件系统的属性来指导测试用例的设计与执行，为解决上述问题提供了新的思路。（二）研究意义本研究旨在深入探讨基于属性的测试库的构建与应用，以提高软件测试的效率和质量，降
【Dive Into Stable Diffusion v3.5】1：开源项目正式发布——深入探索SDv3.5模型全参/LoRA/RLHF训练 Donvink 大模型 #AIGC stable diffusion AIGC 人工智能机器学习深度学习
目录1引言2项目简介3快速上手3.1下载代码3.2环境配置3.3项目结构3.4下载模型与数据集3.5运行指令3.6核心参数说明3.6.1通用参数3.6.2优化器/学习率3.6.3数据相关4结语1引言在人工智能和机器学习领域，生成模型的应用越来越广泛。StableDiffusion作为其中的佼佼者，因其强大的图像生成能力而备受关注。今天，我的开源项目DiveIntoStableDiffusionv3
3月20日复盘四万二千正式复盘 python 前端机器学习
挑战全栈第八天！今天更新Python中的迭代器和生成器，以及函数式编程的内容。8.3super().init()super().__init__()是Python中用于调用父类（基类）构造函数的一种方式。它通常用于子类的构造函数中，以确保父类的构造函数被正确调用和初始化。这在继承（inheritance）中尤为重要，因为父类的初始化代码可能包含设置实例变量或执行其他重要的初始化任务。classPa
Python + Qt Designer构建多界面GUI应用程序：Python如何调用多个界面文件懒大王爱吃狼 python python qt 命令模式 mysql 数据库 Python基础开发语言
引言QtDesigner是一个用户友好的图形用户界面设计工具，它可以帮助开发人员通过拖放的方式快速创建界面。在实际开发中，往往需要设计多个界面文件，并在Python代码中进行统一管理和使用。本文将介绍如何在Python中使用QtDesigner设计好的多个界面文件的常用方法。方法一：单独加载并显示如果界面文件相对独立，并且没有复杂的依赖关系，可以考虑单独加载并显示每个界面文件。fromPyQt5i
PyTorch 深度学习实战（19）：离线强化学习与 Conservative Q-Learning (CQL) 算法进取星辰 PyTorch 深度学习实战深度学习 pytorch 算法
在上一篇文章中，我们探讨了分布式强化学习与IMPALA算法，展示了如何通过并行化训练提升强化学习的效率。本文将聚焦离线强化学习（OfflineRL）这一新兴方向，并实现ConservativeQ-Learning(CQL)算法，利用Minari提供的静态数据集训练安全的强化学习策略。一、离线强化学习与CQL原理1.离线强化学习的特点无需环境交互：直接从预收集的静态数据集学习数据效率高：复用历史经验
Java IDEA中Gutter Icons图标的含义路宇 java笔记 java intellij-idea 开发语言 gutter-icons 图标 Java开发工具
前些天发现了一个蛮有意思的人工智能学习网站,8个字形容一下"通俗易懂，风趣幽默"，感觉非常有意思,忍不住分享一下给大家。点击跳转到教程前言：很多人刚开始用IDEA来学习编程，会发现下面这些图标。但是我们有时候并不知道它的含义和设置显示与隐藏，下面给大家讲解一下装订线图标位于左侧编辑器中。它们调用一些基本操作以及其他特定于框架和技术的功能。设置步骤File->Setting进到idea的设置页面。接
【科大讯飞笔试题汇总】2024-04-21-科大讯飞春招笔试题-三语言题解(CPP/Python/Java) 春秋招笔试突围最新互联网春秋招试题合集 python java 开发语言春招笔试互联网大厂笔试题
大家好这里是KK爱Coding，一枚热爱算法的程序员✨本系列打算持续跟新科大讯飞近期的春秋招笔试题汇总～ACM银牌|多次AK大厂笔试｜编程一对一辅导感谢大家的订阅➕和喜欢KK这边最近正在收集近一年互联网各厂的笔试题汇总，如果有需要的小伙伴可以关注后私信一下KK领取，会在飞书进行同步的跟新，5月1日之前限时免费领取哦，后续会由ACM银牌团队持续维护~。文章目录01.硬币最少组合问题问题描述输入格式输
【科研必备】EI/Scopus收录！2025年3-4月智能制造、自动化、无人驾驶、人工智能等前沿领域国际会议邀您参与~与全球学者交流，让学术之光在国际舞台上闪耀！努力毕业的小土博^_^ 学术会议推荐制造自动化人工智能深度学习神经网络算法
【科研必备】EI/Scopus收录！2025年3-4月智能制造、无人驾驶、人工智能等前沿领域国际会议邀您参与~与全球学者交流，让学术之光在国际舞台上闪耀！【科研必备】EI/Scopus收录！2025年3-4月智能制造、无人驾驶、人工智能等前沿领域国际会议邀您参与~与全球学者交流，让学术之光在国际舞台上闪耀！文章目录【科研必备】EI/Scopus收录！2025年3-4月智能制造、无人驾驶、人工智能等
Pycharm python解释器 unsupported python 3.1 解决大表哥在曾母暗沙 Python PyCharm python pycharm ide 解释器模式
Pycharm环境unsupportedpython3.1解决1.问题重现2.原因分析3.解决方法1.问题重现之前使用Pycharm2024.1.1的时候，环境配置的Python3.11.9，现在改成使用Pycharm2020.2.2，结果Python解释器显示“unsupportedpython3.1”，如下图：2.原因分析因为Pycharm2020.2.2支持的Python最高版本就是Pyth
申请 Let's Encrypt 的免费 TLS 证书实现网站的 https 访问 python
因为这个使用apt安装的python第三方包的版本为什么这么滞后？原因，所以我不是用sudo把证书弄到系统路径，而是选择到普通用户路径下面╭─pon@aliyun2core2GB~/certbot╰─➤tree.├──config│ ├──accounts│ │ └──acme-v02.api.letsencrypt.org│ │ └──directory│ │ └──9401598
一切皆是映射：DQN训练加速技术：分布式训练与GPU并行 AI天才研究院计算 AI大模型企业级应用开发实战 ChatGPT 计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
1.背景介绍1.1深度强化学习的兴起近年来，深度强化学习（DeepReinforcementLearning，DRL）在游戏、机器人控制、自然语言处理等领域取得了令人瞩目的成就。作为一种结合深度学习和强化学习的强大技术，DRL能够使智能体在与环境交互的过程中学习最优策略，从而实现自主决策和控制。1.2DQN算法及其局限性深度Q网络（DeepQ-Network，DQN）是DRL的一种经典算法，它利用
python面试题详解 __wishing__ python
十道经典面试题（python）1.一行代码实现累加1-100之和print(sum(range(1,101)))输出结果：5050分析：利用sum函数进行累加。range控制序列。2.一行代码实现列表去重#声明需要去重的列表list1=[1,1,2,2,3,3,4,4]list1=list(set(list1))</
LangChain入门：使用Python和通义千问打造免费的Qwen大模型聊天机器人南七小僧人工智能网站开发 AI技术产品经理服务器数据库 windows
前言LangChain是一个用于开发由大型语言模型（LargeLanguageModels，简称LLMs）驱动的应用程序的框架。它提供了一个灵活的框架，使得开发者可以构建具有上下文感知能力和推理能力的应用程序，这些应用程序可以利用公司的数据和APIs。这个框架由几个部分组成。LangChain库：Python和JavaScript库。包含了各种组件的接口和集成，一个基本的运行时，用于将这些组件组合
大规模语言模型从理论到实践分布式训练的集群架构 AI智能涌现深度研究 DeepSeek R1 &大数据AI人工智能 Python入门实战计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
大规模语言模型从理论到实践分布式训练的集群架构作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来随着深度学习技术的飞速发展，大规模语言模型（LargeLanguageModels,LLMs）在自然语言处理（NaturalLanguageProcessing,NLP）领域取得了突破性进展。LLMs，如BERT、GPT-3等，通
pygmsh 项目常见问题解决方案葛雨禹
pygmsh项目常见问题解决方案pygmsh:spider_web:GmshforPython项目地址:https://gitcode.com/gh_mirrors/py/pygmsh1.项目基础介绍和主要编程语言项目名称:pygmsh项目简介:pygmsh是一个结合了Gmsh和Python的开源项目。它通过提供Gmsh的Python接口，简化了复杂几何体的创建过程。pygmsh提供了许多有用的抽
python之gmsh划分网格老歌老听老掉牙 python有限元分析 python 开发语言 gmsh 划分网格
Gmsh（GeometryModelingandMeshingSuite）是一个开源的三维有限元网格生成器，它集成了内置的CAD引擎和后处理器。Gmsh的设计目标是提供一个快速、轻量级且用户友好的网格工具，同时具备参数化输入和高级可视化能力。Gmsh围绕几何（geometry）、网格（mesh）、求解器（solver）和后处理（post-processing）四个模块构建，用户可以通过图形用户界面
图生视频技术的发展与展望：从技术突破到未来图景 Liudef06 Stable Diffusion 音视频人工智能深度学习 stable diffusion
一、技术发展现状图生视频（Image-to-VideoGeneration）是生成式人工智能（AIGC）的重要分支，其核心是通过单张或多张静态图像生成动态视频序列。近年来，随着深度学习、多模态融合和计算硬件的进步，图生视频技术经历了从基础研究到商业落地的快速演进。早期探索与GAN的奠基早期图生视频技术主要基于生成对抗网络（GAN），通过对抗训练生成低分辨率的视频片段。例如，DeepMind的DVD
已解决：python多线程使用TensorRT输出为零？附tensorrt推理代码李卓璐算法实战 python 开发语言
我是多个不同类型的模型多线程调用报错。设备：cuda12.1,cudnn8.9.2,tensorrt8.6.11.问题tensorrt的推理没输出？？？有输入：想要的输出：原因：多进程时,每进程应单独调用importpycuda.driverascuda和cuda.init()，完成初始化CUDA驱动，并需要使用self.cfx.push()和self.cfx.pop()管理CUDA上下文，以保证
Python 的 ultralytics 库详解白.夜人工智能
ultralytics是一个专注于计算机视觉任务的Python库，尤其以YOLO（YouOnlyLookOnce）系列模型为核心，提供了简单易用的接口，支持目标检测、实例分割、姿态估计等任务。本文将详细介绍ultralytics库的功能、安装方法、核心模块以及使用示例。1.ultralytics库简介ultralytics库由Ultralytics团队开发，旨在为YOLO系列模型提供高效、灵活且易
输入某年某月某日，判断这一天是这一年的第几天python 发现文化fu python python
题目：输入某年某月某日，判断这一天是这一年的第几天python输入某年某月某日，判断这一天是这一年的第几天python思路：*判断闰年能被4整除但不能被100整除，年份能被400整除#方法1sum=0if(year%4==0andyear%100!=0)oryear%400==0:feb=29else:feb=28month_day=[0,31,feb,31,30,31,30,31,31,30,3
python练习3：输入某年某月某日，判断这一天是这一年的第几天？柯.姐姐 python
#输入某年某月某日，判断这一天是这一年的第几天？list=[0,31,59,90,120,151,181,212,243,273,304,334]year=int(input('请输入年份：'))month=int(input('请输入月份：'))day=int(input('请输入天：'))ifmonth>0andmonth2:result=result+1print("这是第%d天"%resu
初学python100例-案例4 计算一年第几天多种不同解法少儿编程案例讲解小兔子编程初学python100例 python学习 python100例 python计算天数 python算法 python案例
题目输入某年某月某日，判断这一天是这一年的第几天？解法1程序分析1、以5月2日为例，应该先把前四个月的加起来，2、然后再加上2天即本年的第几天，3、特殊情况，闰年且输入月份大于2时需考虑多加一天：4、闰年1、年份能被4整除；2、年份若是100的整数倍的话需被400整除，否则是平年。程序源代码：year=int(input('year:\n'))month=int(input('month:\n')
Python 的类中，self 是一个特殊的参数可可乐不加冰知识学习专栏 python 开发语言
在Python的类中，self是一个特殊的参数，它代表类的实例本身。self是方法的第一个参数，用于访问实例的属性和方法。下面我将从多个角度解释self的含义、作用以及如何使用它。1.self表示类的实例本身在Python中，当你创建一个类的实例时，实际上是在内存中创建了一个对象。self参数代表的就是这个对象本身。通过self，你可以在类的方法中访问和修改实例的属性。2.为什么需要self？se
Trae AI 上新 SSHremote：服务器 Python 接口日志排查实战指南芯作者 DD：日记人工智能深度学习机器学习
在当今的软件开发中，服务器端的稳定性和可靠性至关重要。然而，生产环境中的问题往往难以预测，尤其是接口返回502错误却无日志记录的情况，更是让开发者头疼不已。幸运的是，字节跳动推出的AI原生IDE——Trae，近期上线的SSHremote功能，为远程服务器日志排查提供了全新的解决方案。本文将结合实战案例，深入探讨如何利用TraeAI的SSHremote功能高效排查Python接口日志问题，并分享创新
Python入门程序练习004：输入某年某月某日，判断这一天是这一年的第几天？若北辰 Python实战练习
【程序4】题目：输入某年某月某日，判断这一天是这一年的第几天？1.程序分析：其实这一题的难度不在于编程，而在于对闰年有没有一些基本的认识，相信很多人都知道闰年，但是又不太清楚具体怎么判断闰年。在下面两个条件中只要满足一个即是闰年：1、能被4整除但是不能被一百整除2、能被四百整除。为了方便记忆，总结为：四年一闰,百年不闰,四百年再闰那么判断出闰年和平年（除了闰年其他都是平年）之后呢，其实只要记住：闰
Python后端学习系列（10）：分布式系统与数据一致性（使用分布式锁、分布式事务等） DoYangTan python 学习分布式
Python后端学习系列（10）：分布式系统与数据一致性（使用分布式锁、分布式事务等）前言随着业务规模的不断扩大以及对系统性能、可扩展性的更高要求，后端应用往往会朝着分布式系统的方向发展。然而，分布式系统带来诸多优势的同时，也面临着如数据一致性等复杂的挑战。本期我们就聚焦于分布式系统中的关键问题——数据一致性，深入探讨分布式锁、分布式事务等相关知识以及保障数据一致性的策略与实践，让我们一起深入学习
scala的option和some 矮蛋蛋编程 scala
原文地址： http://blog.sina.com.cn/s/blog_68af3f090100qkt8.html 对于学习 Scala 的 Java™ 开发人员来说，对象是一个比较自然、简单的入口点。在本系列前几期文章中，我介绍了 Scala 中一些面向对象的编程方法，这些方法实际上与 Java 编程的区别不是很大。我还向您展示了 Scala 如何重新应用传统的面向对象概念，找到其缺点
NullPointerException Cb123456 android BaseAdapter
java.lang.NullPointerException: Attempt to invoke virtual method 'int android.view.View.getImportantForAccessibility()' on a null object reference 出现以上异常.然后就在baidu上
PHP使用文件和目录天子之骄 php文件和目录读取和写入 php验证文件 php锁定文件
PHP使用文件和目录 1.使用include()包含文件 (1)：使用include()从一个被包含文档返回一个值 (2)：在控制结构中使用include() include_once()函数需要一个包含文件的路径，此外，第一次调用它的情况和include()一样，如果在脚本执行中再次对同一个文件调用，那么这个文件不会再次包含。在php.ini文件中设置
SQL SELECT DISTINCT 语句何必如此 sql
SELECT DISTINCT 语句用于返回唯一不同的值。 SQL SELECT DISTINCT 语句在表中，一个列可能会包含多个重复值，有时您也许希望仅仅列出不同（distinct）的值。 DISTINCT 关键词用于返回唯一不同的值。 SQL SELECT DISTINCT 语法 SELECT DISTINCT column_name,column_name F
java冒泡排序 3213213333332132 java 冒泡排序
package com.algorithm; /** * @Description 冒泡 * @author FuJianyong * 2015-1-22上午09:58:39 */ public class MaoPao { public static void main(String[] args) { int[] mao = {17,50,26,18,9,10
struts2.18 +json,struts2-json-plugin-2.1.8.1.jar配置及问题！ 7454103 DAO spring Ajax json qq
struts2.18 出来有段时间了！（貌似是稳定版）闲时研究下下！貌似 sruts2 搭配 json 做 ajax 很吃香！实践了下下！不当之处请绕过！呵呵网上一大堆 struts2+json 不过大多的json 插件都是 jsonplugin.34.jar strut
struts2 数据标签说明 darkranger jsp bean struts servlet Scheme
数据标签主要用于提供各种数据访问相关的功能，包括显示一个Action里的属性，以及生成国际化输出等功能数据标签主要包括： action ：该标签用于在JSP页面中直接调用一个Action，通过指定executeResult参数，还可将该Action的处理结果包含到本页面来。 bean ：该标签用于创建一个javabean实例。如果指定了id属性，则可以将创建的javabean实例放入Sta
链表.简单的链表节点构建 aijuans 编程技巧
/*编程环境WIN-TC*/ #include "stdio.h" #include "conio.h" #define NODE(name, key_word, help) \ Node name[1]={{NULL, NULL, NULL, key_word, help}} typedef struct node { &nbs
tomcat下jndi的三种配置方式 avords tomcat
jndi(Java Naming and Directory Interface，Java命名和目录接口)是一组在Java应用中访问命名和目录服务的API。命名服务将名称和对象联系起来，使得我们可以用名称访问对象。目录服务是一种命名服务，在这种服务里，对象不但有名称，还有属性。 tomcat配置
关于敏捷的一些想法 houxinyou 敏捷
从网上看到这样一句话：“敏捷开发的最重要目标就是：满足用户多变的需求，说白了就是最大程度的让客户满意。” 感觉表达的不太清楚。感觉容易被人误解的地方主要在“用户多变的需求”上。第一种多变，实际上就是没有从根本上了解了用户的需求。用户的需求实际是稳定的，只是比较多，也比较混乱，用户一般只能了解自己的那一小部分，所以没有用户能清楚的表达出整体需求。而由于各种条件的，用户表达自己那一部分时也有
富养还是穷养，决定孩子的一生 bijian1013 教育人生
是什么决定孩子未来物质能否丰盛？为什么说寒门很难出贵子，三代才能出贵族？真的是父母必须有钱，才能大概率保证孩子未来富有吗？-----作者：@李雪爱与自由事实并非由物质决定，而是由心灵决定。一朋友富有而且修养气质很好，兄弟姐妹也都如此。她的童年时代，物质上大家都很贫乏，但妈妈总是保持生活中的美感，时不时给孩子们带回一些美好小玩意，从来不对孩子传递生活艰辛、金钱来之不易、要懂得珍惜
oracle 日期时间格式转化征客丶 oracle
oracle 系统时间有 SYSDATE 与 SYSTIMESTAMP； SYSDATE：不支持毫秒，取的是系统时间； SYSTIMESTAMP：支持毫秒，日期，时间是给时区转换的，秒和毫秒是取的系统的。日期转字符窜：一、不取毫秒： TO_CHAR(SYSDATE, 'YYYY-MM-DD HH24:MI:SS') 简要说明， YYYY 年 MM 月
【Scala六】分析Spark源代码总结的Scala语法四 bit1129 scala
1. apply语法 FileShuffleBlockManager中定义的类ShuffleFileGroup，定义： private class ShuffleFileGroup(val shuffleId: Int, val fileId: Int, val files: Array[File]) { ... def apply(bucketId
Erlang中有意思的bug bookjovi erlang
代码中常有一些很搞笑的bug，如下面的一行代码被调用两次（Erlang beam） commit f667e4a47b07b07ed035073b94d699ff5fe0ba9b Author: Jovi Zhang <[email protected]> Date: Fri Dec 2 16:19:22 2011 +0100 erts:
移位打印10进制数转16进制-2008-08-18 ljy325 java 基础
/** * Description 移位打印10进制的16进制形式 * Creation Date 15-08-2008 9:00 * @author 卢俊宇 * @version 1.0 * */ public class PrintHex { // 备选字符 static final char di
读《研磨设计模式》-代码笔记-组合模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; abstract class Component { public abstract void printStruct(Str
利用cmd命令将.class文件打包成jar chenyu19891124 cmd jar
cmd命令打jar是如下实现：在运行里输入cmd，利用cmd命令进入到本地的工作盘符。(如我的是D盘下的文件有此路径 D:\workspace\prpall\WEB-INF\classes) 现在是想把D:\workspace\prpall\WEB-INF\classes路径下所有的文件打包成prpall.jar。然后继续如下操作： cd D: 回车 cd workspace/prpal
[原创]JWFD v0.96 工作流系统二次开发包 for Eclipse 简要说明 comsci eclipse 设计模式算法工作 swing
JWFD v0.96 工作流系统二次开发包 for Eclipse 简要说明 &nb
SecureCRT右键粘贴的设置 daizj secureCRT 右键粘贴
一般都习惯鼠标右键自动粘贴的功能，对于SecureCRT6.7.5 ，这个功能也已经是默认配置了。老版本的SecureCRT其实也有这个功能，只是不是默认设置，很多人不知道罢了。菜单： Options->Global Options ...->Terminal 右边有个Mouse的选项块。 Copy on Select Paste on Right/Middle
Linux 软链接和硬链接 dongwei_6688 linux
1.Linux链接概念Linux链接分两种，一种被称为硬链接（Hard Link），另一种被称为符号链接（Symbolic Link）。默认情况下，ln命令产生硬链接。【硬连接】硬连接指通过索引节点来进行连接。在Linux的文件系统中，保存在磁盘分区中的文件不管是什么类型都给它分配一个编号，称为索引节点号(Inode Index)。在Linux中，多个文件名指向同一索引节点是存在的。一般这种连
DIV底部自适应 dcj3sjt126com JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
Centos6.5使用yum安装mysql——快速上手必备 dcj3sjt126com mysql
第1步、yum安装mysql [root@stonex ~]# yum -y install mysql-server 安装结果： Installed: mysql-server.x86_64 0:5.1.73-3.el6_5 &nb
如何调试JDK源码 frank1234 jdk
相信各位小伙伴们跟我一样，想通过JDK源码来学习Java，比如collections包，java.util.concurrent包。可惜的是sun提供的jdk并不能查看运行中的局部变量，需要重新编译一下rt.jar。下面是编译jdk的具体步骤： 1.把C:\java\jdk1.6.0_26\sr
Maximal Rectangle hcx2013 max
Given a 2D binary matrix filled with 0's and 1's, find the largest rectangle containing all ones and return its area. public class Solution { public int maximalRectangle(char[][] matrix)
Spring MVC测试框架详解——服务端测试 jinnianshilongnian spring mvc test
随着RESTful Web Service的流行，测试对外的Service是否满足期望也变的必要的。从Spring 3.2开始Spring了Spring Web测试框架，如果版本低于3.2，请使用spring-test-mvc项目（合并到spring3.2中了）。 Spring MVC测试框架提供了对服务器端和客户端（基于RestTemplate的客户端）提供了支持。 &nbs
Linux64位操作系统（CentOS6.6）上如何编译hadoop2.4.0 liyong0802 hadoop
一、准备编译软件 1.在官网下载jdk1.7、maven3.2.1、ant1.9.4，解压设置好环境变量就可以用。环境变量设置如下：（1）执行vim /etc/profile （2）在文件尾部加入: export JAVA_HOME=/home/spark/jdk1.7 export MAVEN_HOME=/ho
StatusBar 字体白色 pangyulei status
[[UIApplication sharedApplication] setStatusBarStyle:UIStatusBarStyleLightContent]; /*you'll also need to set UIViewControllerBasedStatusBarAppearance to NO in the plist file if you use this method
如何分析Java虚拟机死锁 sesame java thread oracle 虚拟机 jdbc
英文资料： Thread Dump and Concurrency Locks Thread dumps are very useful for diagnosing synchronization related problems such as deadlocks on object monitors. Ctrl-\ on Solaris/Linux or Ctrl-B
位运算简介及实用技巧（一）：基础篇 tw_wangzhengquan 位运算
http://www.matrix67.com/blog/archives/263 去年年底写的关于位运算的日志是这个Blog里少数大受欢迎的文章之一，很多人都希望我能不断完善那篇文章。后来我看到了不少其它的资料，学习到了更多关于位运算的知识，有了重新整理位运算技巧的想法。从今天起我就开始写这一系列位运算讲解文章，与其说是原来那篇文章的follow-up，不如说是一个r
jsearch的索引文件结构 yangshangchuan 搜索引擎 jsearch 全文检索信息检索 word分词
jsearch是一个高性能的全文检索工具包，基于倒排索引，基于java8，类似于lucene，但更轻量级。 jsearch的索引文件结构定义如下： 1、一个词的索引由=分割的三部分组成：第一部分是词第二部分是这个词在多少

Deepfacelab 训练参数详解，从入门到精通。值得收藏

你可能感兴趣的:(人工智能,神经网络,图像处理,深度学习,python)