萤火架构

手把手教你在云环境炼丹：Stable Diffusion LoRA 模型保姆级炼制教程

很多同学都想要自己的专属AI模型，但是大模型的训练比较费时费力，不太适合普通用户玩。AI开发者们也意识到了这个问题，所以就产生了微调模型，LoRA就是其中的一种。在AI绘画领域，只需要少量的一些图片，就可以训练出一个专属风格的LoRA模型，比如某人的脸、某个姿势、某种画风、某种物体，等等。

训练模型经常被大家戏称为“炼丹”，这个词既给我们带来了美好的期待，也体现了模型创作过程的不易。如同炼丹需要精心呵护，AI模型的训练也需要耐心和细致。然而，即使付出了辛勤的努力，最终的结果也未必能如人意。这是大家需要做好的心理准备。

LoRA的原理网上已经有很多介绍，我就不说了。本文专门介绍在云环境怎么训练LoRA模型，所谓云环境就是租用云服务器，而不是在本地电脑上，这特别适合想一展身手但是手里又没有一块好显卡的同学。

这里的云环境选择我经常使用的AutoDL：https://www.autodl.com , 关于AutoDL的使用方法，本文只围绕训练LoRA模型做一些简单的介绍，想了解更多的同学请看我写的另一篇文章：手把手教你在云环境部署 Stable Diffusion WebUI 。

本文将使用 kohya_ss 这个开源项目来训练LoRA模型，下面正式开始。

云环境

AutoDL上需要先充值然后才能租用服务器，可以先来2块钱的，以便完成本次训练。

服务器

简单说下，计费方式选择“按量计费”，地区选择“内蒙A区”，GPU型号选择“RTX A5000”，GPU数量选择“1”，然后选择1个有空闲GPU的主机。

镜像这里选择“社区镜像”，输入“yinghuoai-kohya”，在弹出的菜单中选择我发布的这个镜像。

然后点击“立即创建”就可以了。

在 AutoDL 控制台等待服务器实例开机，开机成功后，在快捷工具这里可以看到一些操作项，点击其中的“JupyterLab”。

在 JupyterLab 中点击笔记本上方的双箭头按钮，它会进行一些初始化操作，并启动 kohya_ss，待看到“Running on local URL”的提示后，就说明启动成功了。

然后回到 AutoDL 控制台，点击快捷工具中的“自定义服务”，即可启动 kohya_ss 的Web界面。

训练目录

为了有效的管理模型训练，我在镜像中创建了几个目录，可以通过“JupyterLab”查看，它们都在 /root/autodl-tmp 下边，autodl-tmp 挂载的是 AutoDL 的数据盘，可以节省宝贵的系统盘空间。

/root/autodl-tmp/models：SD大模型目录，训练Lora模型时需要基于某个大模型。
/root/autodl-tmp/train：训练数据的目录，包括输入的图片、训练的参数、输出的Lora模型等，我们将在这个目录下创建不同的训练项目目录。

实际效果如下图所示：

快速体验

我在镜像中内置了一份训练数据和训练配置，可以让大家快速体验 Lora 炼丹。

通过 AutoDL 的自定义服务启动页面后，依次点击“LoRA”->“Training”。

在“Configuration file”这里输入我提前预置好的训练配置文件地址：/root/autodl-tmp/train/dudu/config.json ；
然后点击“Load”加载训练参数；
最后点击“Start training”开始训练。

训练的进度需要去 JupterLab 中查看，大约需要8分钟，当看到 steps 显示 100%的时候就说明训练完成了，模型已经保存到目录：/root/autodl-tmp/train/dudu/model

训练过程中会生成几张采样图片，保存在 /root/autodl-tmp/train/dudu/model/sample ，可以打开看看训练的效果：

为了实际体验，需要把模型文件先下载到本地，然后再上传到 Stable Diffusion WebUI，使用文生图生成图片，参考参数：

大模型：realisticVisionV51_v51VAE，其它真实模型也可以试试。
提示词：masterpiece, best quality, 1dog, solo, sitting, looking at viewer, outdoor, the background is egyptian pyramids,tall pyramids
反向提示词：low quality, worst quality, harness, tree, bad anatomy,bad composition, poor, low effort
图片尺寸：768*768

注意：如果你要重新训练这个项目，需要先删除 model 目录下的内容，然后再重新开始训练。

快速体验只能让大家简要领略炼丹的魅力。然而，要炼就一颗完美的丹药，还需备足图片素材、洞悉工具参数设置，以及不断测试优化模型。接下来，我将为大家详细解析如何步步为营，精心打造你的LoRA模型。

准备

主要就是准备好要训练的图片，以及为图片生成提示词。然后才能把它们送进丹炉进行炼制。

挑选图片

训练LoRA模型到底需要几张图片？我没找到具体要求，建议至少10张以上，并且要求图片清晰有质感，如果是针对某种个体的，拍摄目标的角度要多样，这样才可能训练出比较好的模型。

如果你手头没有合适的图片，可以自己拍摄，也可以去百度图片等图片网站找高清大图。

网上的教程大多是训练美女脸的，估计大家也都看烦了，所以我选择了一个狗子的图片进行训练，它的名字叫dudu，样子大概是下图这样的。我准备的图片数量有20张，已经内置到我发布的 AutoDL 镜像中。

裁切图片

图片需要处理成一样的尺寸，尺寸可以是 512*512、512*768，512*640，都是64的倍数。显存低的可以用 512，显存高的可以用 768。这里给大家分享一个裁切图片的网站：BIRME - Bulk Image Resizing Made Easy 2.0 (Online & Free) ，操作方式如下图所示：

左边选择本地要裁切的图片。
右边是裁切设置，可以设置裁切的尺寸等。

注意 RENAME 可以让输出的图片名称更加有序，方便训练程序使用，xxx 代表三位数字，下边的 starting number 代表从哪个数字开始排序。

部署图片

图片处理成功后，需要放到特定的目录中。

我们先在 /root/autodl-tmp/train 下创建一个项目目录，我这里就用狗子的名字：dudu，然后在这个目录下再创建一个 img 目录，用于放置处理好的图片，不过图片还不能直接放到 img 下，还需要创建一个子目录：100_dudu，这个目录的名字是有讲究的，前边的100代表每张图片需要学习100次，后边的 dudu 就是图片的主题名字。

这里的学习次数没有固定的标准，真实图片建议50-100，二次元15-30。如果最终训练出的模型出现过拟合的问题，比如生图提示词写了蓝眼睛但是生成的都是黑眼睛，可以降低下学习次数试试。

把裁切好的图片上传到 /root/autodl-tmp/train/dudu/img/100_dudu 这个目录，如下图所示：

图片打标

所谓打标就是给图片编写提示词，一般先使用提示词反推工具生成提示词，然后再根据实际情况修改生成的提示词。

启动 kohya_ss 后，进入打开的 Web 页面，依次进入“Utilities”->“Captioning”->"BLIP Captioning"。

“Image folder to caption”中输入待打标的图片目录，我这里就是：/root/autodl-tmp/train/dudu/img/100_dudu。

“Caption file extension”是生成的提示词文件的后缀名。

“Prefix to add to BLIP caption”是添加到生成提示词中的固定前缀，训练中如果使用了这些前缀，生成图片时就可以使用这些前缀比较方便的触发Lora模型，但是根据经验也不能保证一定触发。后边还有一个参数“Postfix to add BLIP caption”，这个是固定后缀。前缀在处理图片时的优先级更高一些。

其它参数都用默认就好了，有兴趣的可以研究下，我这里就不展开了。

最后点击“Caption images”。

注意这个工具的页面中都没有进度跟踪，需要到 shell 或者控制台界面查看，看到 100% 的进度条，以及“captioning done”的提示就说明打标完成了。

此时我们进入待训练的图片目录，就可以看到这些打标文件了。可以看到，每张图片都生成了对应的打标文件。

我们可以双击打开这些 txt 文件，查看其中的内容；如果感觉写的不好，可以修改它。

生成的提示词一般多多少都会有些问题。

对于画风类型的Lora，可以保留全部生成的标签，但是在训练时要多训练几轮，训练时间可能比较长。
对于特定角色的Lora，如果我们想保留某个特征作为角色的自带特征，就把对应的标签删除，比如长头发，这样Lora中就会保存长头发作为角色的特征。不过这也是有缺点的，可能导致生成图片时过拟合：提示词不生效，比如输入短发生成的还是长发，严重的还可能导致画面崩坏、模糊不清。

修改提示词是个大工程，这里为了尽快演示，就不修改提示词了。

另外在这个工具中，我们可以看到，除了 BLIP，还有三个给图片打标的方法，不过我都没有跑成功，有兴趣的可以一起研究下。

如果你不使用 kohya_ss 自带的打标工具，也是完全可以的，比如 SD WebUI 的“训练”功能中也可以裁切图片并反推提示词，只是需要手动上传打标文件到这里的训练目录中。这里再推荐一个提示词编辑工具：https://github.com/starik222/BooruDatasetTagManager，有兴趣的可以去试试。

训练

参数设置

训练模型的参数很多，还会涉及到深度学习的一些概念，之前没接触过的同学可能会感觉头疼，不过没关系，我会尽量把主要的参数说清楚。

kohya_ss 启动后，依次进入“LoRA”->“Training”。

Source Model

设置训练使用的 Stable Diffusion 大模型，“Model Quic Pick”这里可以选择一些 SD 的基础大模型，训练的时候会先去 HuggingFace 下载，不过我实际测试跑不同，所以这里选择 custom，然后自己上传一个模型，因为训练图片是真实世界的狗子，所以这里使用了realisticVisionV51（使用AutoDL镜像的同学不用再上传，已经内置了），这是一个真实视觉模型。

Folders

设置训练模型时的输入输出目录。

Image folder 是训练数据集的目录，也就是原图片的目录，注意只到 img 这一级，不是直接存放图片的目录，这里的完整路径是：/root/autodl-tmp/train/dudu/img 。
Output folder 是训练出的Lora模型保存的目录，训练过程中的采样图片也保存在这个目录下，和 Image folder 使用同一个上级目录就行了，这里的完整路径是：/root/autodl-tmp/train/dudu/model 。
Logging folder 顾名思义，就是训练的日志目录，和 Image folder 使用同一个上级目录就行了，这里的完整路径是：/root/autodl-tmp/train/dudu/log 。
Model output name 是训练出的Lora模型的文件名前缀。

Parameters

进入到真正的参数设置环节了，前边只是些开胃小菜。

先来看基本参数（Basic）：

Train batch size：同时训练的样本图片数，默认为1，显存 12G 以上可以设置为2-6，请根据实际显存使用情况设置，数值越大训练速度越快。
Epoch：训练的轮数，一轮就是把所有的样本图片完成一次训练。一般需要训练多轮，然后根据实际生图情况选择合适的轮次模型。轮数越大，训练需要的时间越多。
Save every N epochs：每隔几轮保存一次训练出的模型，我们想要测试每一轮输出的模型，所以这里填写1。
Caption Extension：样本图片对应的打标文件的后缀名，之前打标用的是 .txt，这里填上就行了。
Mixed precision 和 Save precision：计算使用的浮点数精度控制，都选择fp16就好了，可以节省内存使用。bf16精度略低，但是表示的整数范围更大，数据类型转换也更容易，不过要看显卡能不能支持。
Number of CPU threads per core：单个CPU核心的线程数，可以理解为一个CPU核心可以同时干两件事。一般都是2，我租用的这台服务器也是2，可以用 lscpu 等命令查看。不确定的设置为1。
Seed：训练使用的随机数，随便填一个就行。如果需要提升之前构建过的模型（在 LoRA network weights 中填写之前构建过的模型），使用相同的随机数。
Cache latents：勾选上，可以让训练速度更快。
Learning rate：学习率，可以理解为每次学习走过的长度，值越小，训练的越慢，值越大，步子越大，就不容易找到规律，模型难以收敛。所谓收敛就是通过训练让模型不断得到优化的过程，难以收敛就是无法优化模型，模型生成的角色和样本图片偏差过大。

这一行都是有关学习率的参数设置，也就是怎么让模型收敛的又快又好，都是一些算法，先用我这里默认的吧，不好使再换。

- LR Scheduler：学习率调度器，它会自动调整学习率，我一般使用constant。
- LR warmup (% of steps)：升温步数，仅在“LR Scheduler”为“constant_with_warmup”时设置，用来控制模型在训练前逐渐增加学习率的步数。
- Optimizer: 主要用来更新模型中的权重和偏差等参数，以便更好的拟合数据。有的优化器也可以直接影响学习率。先试试 AdamW8bit 吧。

Max resolution：训练的最大分辨率，设置为样本图片的分辨率即可。
Enable buckets：启动后支持多种分辨率的样本图片，程序会自动裁切，这里我已经都裁切成768了，勾不勾选无所谓了。
Text Encoder learning rate：文本编码器的学习率，建议从0.00005开始，后面的Unet learning rate要比前面的大，设置成 0.0001，设置这个值会导致忽略上面的 Learing rate，保持一致吧。
Network Rank：模型的神经网络参数维度，默认是8，建议 32、64、128，值越大模型越精细，生成的模型文件也越大。 Network Alpha 保持相同的值就好。

高级参数（Advanced）中我们看下这几个：

Clip skip：默认为1。设置为大于1的数时，在训练时可以跳过一些处理，进而可以避免过拟合，增强模型的泛化能力，但也不易过大，会丢失特征。最好与对应大模型在训练时设置的参数相同。
Memory efficient attention：可以优化显卡内存的使用，但会导致学习速度变慢。
CrossAttention：用于关联图像和提示词的加速算法，一般就选择 xformers，加速图片生成并降低显存占用，xformers只适用于N卡，未来可能应用于其它显卡。

最后还有个采样参数（Samples），使用它可以跟踪训练效果：

Sample every n steps：每学习N步，生成一张图片。

Sample every n epochs：每学习N轮，生成一张图片，实测开启这个会覆盖 Sample every n steps。

Sample sampler：采样器，和SD WebUI中默认的采样器相同。

Sample prompts：采样提示词，这里包括了提示词、反向提示词、图片尺寸、采样步数等。

完成训练

点击“Start Training”之后，还是到控制台中查看处理进度。

因为每张图片学习100步，同时训练的数量是1，所以25张图片训练一次就要学习2500步，同时指定了轮次是3，所以总计是7500步。

训练完成后，可以看到 100% 的提示，模型已经保存到相应的目录。

测试

模型训练好了，怎么知道好不好使呢？那当然要做测试时，实际抽抽卡。

笨点的办法就是挨个测试，测试不同权重、提示词、大模型等情况下的表现。

这里分享一个快速对比测试的方法，使用 X/Y/Z图表。

在提示词中增加变量，如下图所示的样子引用Lora模型：

注意这里的：，NUM和WEIGHT是两个变量。

NUM：因为我使用了多轮次的训练，获得了多个Lora模型，所以需要测试不同训练轮次的模型表现，这些模型的名字是有规律的：dudu_log-000001、dudu_log-000002、... ，每增加一轮训练，生成的模型名字序号就会加1。NUM 就是代表 000001、000002 的变量。
WEIGHT 是使用当前 Lora 模型的权重变量，这里要测试不同权重下模型的表现。

X/Y/Z图表在文生图、图生图页面的最下方：

脚本类型选择：X/Y/Z图表：

X轴类型选择：Prompt S/R，X轴值填写：NUM,000001,000002

Y轴类型选择：Prompt S/R，Y轴值填写：WEIGHT,0.3,0.4,0.5,0.6,0.7,0.8,0.9,1

空格边距填写：2，生成的图片之间做个分割。

然后我们去生成图片，生成图表如下：

然后我们就可以对比不同模型、权重下的出图效果，我这里模型 000002 更接近真实图片，权重 0.5-0.9 效果会比较好，1.0就有点过拟合了。

X/Y/Z图表中还有很多的维度可以测试，比如大模型、迭代步数、采样器、提示词引导系统等等，有兴趣的可以多去尝试下。

优化

仅分享我的一点经验和体会。上面也提到了一些，这里做个总结。

训练用的图片一定要高清，不要模糊，角色尽量多角度，原图对训练结果的差异特别大。如果没有高清的图，可以去 SD WebUI 的图生图中重绘模糊的图片，或者使用其它的软件高清化图片。
训练用的提示词：在提示词中去掉你想在生成图片时保留的角色特征，增加你允许生成图片时替换的角色特征。比如你想保留角色的长头发，那就在提示词中去掉长头发，这样生成图片时就有很大的概率都是长头发；如果你想要角色的眼睛颜色可以替换，就在训练提示词中写上黑色眼睛，这样生成图片时就可以使用蓝色眼睛的提示来更换角色的眼睛颜色。
多轮次训练：训练一轮的效果可能不好，成本允许的话，建议多训练几轮，然后对比不同轮次下的模型出图效果，选择最适合的那个。
训练步数：每张图片训练多少次才合适？训练的少了提取的特征不够，训练多了容易过拟合。二次元建议15-30次，其它图片50-100次。训练的图片少，每张图就可以多训练几次，训练的图片多，每张图就可以少训练几次。

资源下载

本文使用的模型、插件，生成的图片，都已经上传到了我整理的SD绘画资源中，后续也会持续更新，如有需要，请关注公众号：萤火遛AI（yinghuo6ai），发消息：SD，即可获取下载地址。

以上就是本文的主要内容，如有问题欢迎留言。

第79期 | GPTSecurity周报云起无垠 GPTSecurity AIGC gpt
GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区，集成了生成预训练Transformer（GPT）、人工智能生成内容（AIGC）以及大语言模型（LLM）等安全领域应用的知识。在这里，您可以找到关于GPT/AIGC/LLM最新的研究论文、博客文章、实用的工具和预设指令（Prompts）。现为了更好地知悉近一周的贡献内容，现总结如下。SecurityPapers1.TrojanWhi
第60期 | GPTSecurity周报云起无垠 GPTSecurity 人工智能语言模型网络安全
GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区，集成了生成预训练Transformer（GPT）、人工智能生成内容（AIGC）以及大语言模型（LLM）等安全领域应用的知识。在这里，您可以找到关于GPT/AIGC/LLM最新的研究论文、博客文章、实用的工具和预设指令（Prompts）。现为了更好地知悉近一周的贡献内容，现总结如下。SecurityPapers1.映射你的模型：评估
第83期 | GPTSecurity周报云起无垠 GPTSecurity 人工智能网络安全
GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区，集成了生成预训练Transformer（GPT）、人工智能生成内容（AIGC）以及大语言模型（LLM）等安全领域应用的知识。在这里，您可以找到关于GPT/AIGC/LLM最新的研究论文、博客文章、实用的工具和预设指令（Prompts）。现为了更好地知悉近一周的贡献内容，现总结如下。SecurityPapers1.混乱中建立秩序：人
第78期 | GPTSecurity周报 aigcgpts
GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区，集成了生成预训练Transformer（GPT）、人工智能生成内容（AIGC）以及大语言模型（LLM）等安全领域应用的知识。在这里，您可以找到关于GPT/AIGC/LLM最新的研究论文、博客文章、实用的工具和预设指令（Prompts）。现为了更好地知悉近一周的贡献内容，现总结如下。SecurityPapers1.ChatNVD：借
让创意在幻觉中肆虐: 认识Illusion Diffusion AI 程序员
人工智能新境界在不断发展的人工智能领域,一款非凡的新工具应运而生,它能将普通照片转化为绚丽的艺术品。敬请关注IllusionDiffusion,这是一个将现实与想象力完美融合的AI驱动平台,可创造出迷人的视错觉和超现实意境。AI算法的魔力所在IllusionDiffusion的核心是借助先进的AI模型,包括StableDiffusion和ControlNet,来解读用户输入的文本提示,并生成相应的
第81期 | GPTSecurity周报 aigc网络安全
GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区，集成了生成预训练Transformer（GPT）、人工智能生成内容（AIGC）以及大语言模型（LLM）等安全领域应用的知识。在这里，您可以找到关于GPT/AIGC/LLM最新的研究论文、博客文章、实用的工具和预设指令（Prompts）。现为了更好地知悉近一周的贡献内容，现总结如下。SecurityPapers1.大语言模型与代码安
第83期 | GPTSecurity周报 aigcgpts
GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区，集成了生成预训练Transformer（GPT）、人工智能生成内容（AIGC）以及大语言模型（LLM）等安全领域应用的知识。在这里，您可以找到关于GPT/AIGC/LLM最新的研究论文、博客文章、实用的工具和预设指令（Prompts）。现为了更好地知悉近一周的贡献内容，现总结如下。SecurityPapers1.混乱中建立秩序：人
第79期 | GPTSecurity周报 aigcgpts
GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区，集成了生成预训练Transformer（GPT）、人工智能生成内容（AIGC）以及大语言模型（LLM）等安全领域应用的知识。在这里，您可以找到关于GPT/AIGC/LLM最新的研究论文、博客文章、实用的工具和预设指令（Prompts）。现为了更好地知悉近一周的贡献内容，现总结如下。SecurityPapers1.TrojanWhi
智创 AI 新视界 -- 探秘 AIGC 中的生成对抗网络（GAN）应用青云交 #GAN #智创 AI 新视界 #AIGC 人工智能生成对抗网络（GAN）AIGC 图像生成文本生成音乐生成挑战与解决方案
亲爱的朋友们，热烈欢迎你们来到青云交的博客！能与你们在此邂逅，我满心欢喜，深感无比荣幸。在这个瞬息万变的时代，我们每个人都在苦苦追寻一处能让心灵安然栖息的港湾。而我的博客，正是这样一个温暖美好的所在。在这里，你们不仅能够收获既富有趣味又极为实用的内容知识，还可以毫无拘束地畅所欲言，尽情分享自己独特的见解。我真诚地期待着你们的到来，愿我们能在这片小小的天地里共同成长，共同进步。本博客的精华专栏：大数
智创 AI 新视界 -- AIGC 对游戏产业的革命性影响（16 - 8）青云交 AI&人工智能 #智创 AI 新视界 #AIGC AIGC 游戏变革内容创新开发增效体验升级挑战应对智创 AI 新视界游戏产业人工智能
亲爱的朋友们，热烈欢迎你们来到青云交的博客！能与你们在此邂逅，我满心欢喜，深感无比荣幸。在这个瞬息万变的时代，我们每个人都在苦苦追寻一处能让心灵安然栖息的港湾。而我的博客，正是这样一个温暖美好的所在。在这里，你们不仅能够收获既富有趣味又极为实用的内容知识，还可以毫无拘束地畅所欲言，尽情分享自己独特的见解。我真诚地期待着你们的到来，愿我们能在这片小小的天地里共同成长，共同进步。本博客的精华专栏：大数
智创 AI 新视界 -- AIGC 背后的深度学习魔法：从原理到实践青云交 #智创 AI 新视界 #AIGC 1024程序员节 AIGC 人工智能文本生成图像生成未来展望深度学习
亲爱的朋友们，热烈欢迎你们来到青云交的博客！能与你们在此邂逅，我满心欢喜，深感无比荣幸。在这个瞬息万变的时代，我们每个人都在苦苦追寻一处能让心灵安然栖息的港湾。而我的博客，正是这样一个温暖美好的所在。在这里，你们不仅能够收获既富有趣味又极为实用的内容知识，还可以毫无拘束地畅所欲言，尽情分享自己独特的见解。我真诚地期待着你们的到来，愿我们能在这片小小的天地里共同成长，共同进步。本博客的精华专栏：大数
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
OPENAIGC开发者大赛企业组AI黑马奖 | AIGC数智传媒解决方案 RPA中国人工智能 AIGC 传媒
在第二届拯救者杯OPENAIGC开发者大赛中，涌现出一批技术突出、创意卓越的作品。为了让这些优秀项目被更多人看到，我们特意开设了优秀作品报道专栏，旨在展示其独特之处和开发者的精彩故事。无论您是技术专家还是爱好者，希望能带给您不一样的知识和启发。让我们一起探索AIGC的无限可能，见证科技与创意的完美融合！创未来AI应用赛-企业组AI黑马奖作品名称：AIGC数智传媒解决方案参赛团队：深圳市三象智能技术
程序员如何在AI时代保持核心竞争力 nfgo chatgpt 人工智能
程序员如何在AI时代保持核心竞争力随着AIGC（如ChatGPT、MidJourney、Claude等）大语言模型的相继涌现，AI辅助编程工具逐渐普及，程序员的工作方式正在发生深刻的变革。AI不仅能够自动生成代码，还能优化、调试、甚至提出解决方案。这一趋势让许多人担心：AI会不会最终取代部分编程工作？然而，也有人认为AI是提升效率的得力助手。那么，程序员在这个AI崛起的时代该如何应对？是专注某个领
python画图|同时输出二维和三维图西猫雷婶 python 开发语言
前面已经学习了如何输出二维图和三维图，部分文章详见下述链接：python画图|极坐标下的3Dsurface-CSDN博客python画图|垂线标记系列_如何用pyplot画垂直x轴的线-CSDN博客有时候也需要同时输出二位和三维图，因此有必要学习一下。【1】官网教程首先我们打开官网教程，链接如下。https://matplotlib.org/stable/gallery/mplot3d/mixed
AIGC图生视频技术下的巴黎奥运高光时刻阿里云视频云 AIGC与媒体生产 AIGC
共享，奥运夺金时刻。巴黎奥运会的高光片段中国奥运的夺金时刻动漫风格下的别样风态以下AI动漫视频内容BY「阿里云视频云」智能生成从首金到21金镜头倒转尽情回顾······更多巴黎奥运高光时刻更多AIGC精彩内容可在「新华社官方」新媒体账号观看阿里云视频云用视频云+AI，持续助力奥运
【笔记】扩散模型（七）：Latent Diffusion Models（Stable Diffusion）论文解读与代码实现 LittleNyima Diffusion Models 笔记 stable diffusion AIGC 人工智能
论文链接：High-ResolutionImageSynthesiswithLatentDiffusionModels官方实现：CompVis/latent-diffusion、CompVis/stable-diffusion这一篇文章的内容是LatentDiffusionModels（LDM），也就是大名鼎鼎的StableDiffusion。先前的扩散模型一直面临的比较大的问题是采样空间太大，学
什么是AIGC？有哪些免费工具？ chent_某位 AIGC
AIGC（AIGeneratedContent），即“人工智能生成内容”，是指通过人工智能技术自动生成各种类型的数字内容。AIGC让机器能够根据输入的信息或数据生成符合人类需求的文本、图像、音频、视频等内容，极大提高了内容创作的效率。AIGC的背景与起源随着深度学习和自然语言处理技术的快速发展，人工智能已经不再局限于简单的任务，如分类、预测和数据分析，而是具备了生成内容的能力。生成式AI模型，如O
大数据领域的深度分析——AI是在帮助开发者还是取代他们？阳爱铭大数据与数据中台技术沉淀大数据人工智能后端数据库架构数据库开发 etl工程师 chatgpt
在大数据领域，生成式人工智能（AIGC）的应用正在迅速扩展，改变了数据科学家和开发者的工作方式。本文将从大数据的专业视角，探讨AI工具在这一领域的作用，以及它们是如何帮助开发者而非取代他们的。1.大数据领域的AI工具现状在大数据领域，AI工具已经取得了显著进展，以下是几款主要的AI工具及其功能和实际应用：ApacheSpark+MLlib：ApacheSpark是一个开源的分布式计算系统，广泛用于
淘宝教育的视频打不开云雀_ Camera Image Quality Test software skill
淘宝教育的视频打不开，显示：“亲~该课程还未通过审核哦”因为在学习淘宝教育上的课程：所以想在Ubuntu16.04下观看视频；可是打不开哈Browser:google-chrome-stable(89.0.4389.82-1)尝试其它的Browser,下面的Brwoser好像可以，要用一段时间才知道好用不Browser:palemoon(29.1.1-1.gtk2)(downloadweb:htt
【面试系列】Spark 高频面试题解答野老杂谈全网最全IT公司面试宝典面试 spark 职场和发展大数据
欢迎来到我的博客，很高兴能够在这里和您见面！欢迎订阅相关专栏：⭐️全网最全IT互联网公司面试宝典：收集整理全网各大IT互联网公司技术、项目、HR面试真题.⭐️AIGC时代的创新与未来：详细讲解AIGC的概念、核心技术、应用领域等内容。⭐️大数据平台建设指南：全面讲解从数据采集到数据可视化的整个过程，掌握构建现代化数据平台的核心技术和方法。⭐️《遇见Python：初识、了解与热恋》：涵盖了Pytho
Stable Diffusion-AI美女模特写真使用InstantID插件（附插件）快乐星球没有乐人工智能 stable diffusion 美女 midjourney 媒体音视频
ControlNet单元1：上传人脸定位照上传任意一张照片，它的作用是控制最终出图的人物脸部位置。我们可以和第一张图片一样。相关[参数设置如下：控制类型：选择"Instant_ID"预处理器：instant_id_face_keypoints模型：control_instant_id_sdxl控制权重：0.5左右（0.45-0.5）【第四步】图片的生成点击【生成】按钮，我们来看一下最终生成的图片效
Midjourney和 Stable Diffusion，学谁呢? Ai君臣
Midjourney是在线的，可以使用文字制作令人惊叹的AI图片。它与StableDiffusion类似，但也有一些区别。Midjourney只能在互联网上使用，并且需要付费。那么，值得为Midjourney付费吗？它与稳定扩散有何不同？MidjourneyvsStableDiffusion——功能比较您将在本节中找到StableDiffusion和Midjourney之间的详细比较。与Midjo
【Vidu发布】中国首个长时长、高一致性、高动态性Video AI大模型叶锦鲤人工智能
就在昨日（2024年4月27日），北京生数科技有限公司（以下简称“生数科技”）联合清华大学在中关村论坛-未来人工智能先锋论坛上，正式发布中国首个长时长、高一致性、高动态性视频大模型：Vidu。该模型采用生数科技团队原创的Diffusion与Transformer融合的架构U-ViT。据发布会介绍，Vidu不仅支持一键生成长达16秒、分辨率高达1080P的高清视频内容，还能够模拟真实物理世界，拥有丰
人工智能时代，程序员如何保持核心竞争力专家大圣人工智能
在人工智能时代，AIGC大语言模型的涌现和AI辅助编程工具的普及正在深刻改变程序员的工作方式。面对这一趋势，程序员需要认真思考如何保持并提升自身的核心竞争力，以适应时代的发展。一、AI辅助编程对程序员工作的影响（一）AI工具带来的效率提升AI辅助编程工具，如自动补全、代码生成等功能，无疑为程序员的日常编码实践带来了巨大的便利。这些工具能够根据程序员输入的部分代码或提示，快速生成相应的代码片段，大大
【AIGC半月报】AIGC大模型启元：2024.06（下） LeeZhao@ AIGC 人工智能 AI Agent
AIGC大模型启元：2024.06（下）(1)Gen-3(2)Open-Sora1.2（Open-Sora再升级）(3)Claude3.5Sonnet（Claude升级）(4)ChatTTSv3（ChatTTS升级）(5)盘古大模型5.0(6)Falcon2(7)Glyph-ByT5-v2（清华、北大+微软）(8)LLMLeaderboardv2（大语言模型评估框架）(9)豆包MarsCode（字
nginx1.16安装清晨细雨~ nginx centos nginx安装
参考：https://nginx.org/en/linux_packages.html#RHEL-CentOS1.必备条件sudoyuminstallyum-utils2.设置云仓库创建文件：vi/etc/yum.repos.d/nginx.repo内容如下：[nginx-stable]name=nginxstablerepobaseurl=http://nginx.org/packages/ce
【深度学习实战】行人检测追踪与双向流量计数系统【python源码+Pyqt5界面+数据集+训练代码】YOLOv8、ByteTrack、目标追踪、双向计数、行人检测追踪、过线计数阿_旭 AI应用软件开发实战深度学习实战深度学习 python 行人检测行人追踪过线计数
《博主简介》小伙伴们好，我是阿旭。专注于人工智能、AIGC、python、计算机视觉相关分享研究。✌更多学习资源，可关注公-仲-hao:【阿旭算法与机器学习】，共同学习交流~感谢小伙伴们点赞、关注！《------往期经典推荐------》一、AI应用软件开发实战专栏【链接】项目名称项目名称1.【人脸识别与管理系统开发】2.【车牌识别与自动收费管理系统开发】3.【手势识别系统开发】4.【人脸面部活体
【激活函数总结】Pytorch中的激活函数详解： ReLU、Leaky ReLU、Sigmoid、Tanh 以及 Softmax 阿_旭深度学习知识点 pytorch 人工智能 python 激活函数深度学习
《博主简介》小伙伴们好，我是阿旭。专注于人工智能、AIGC、python、计算机视觉相关分享研究。感谢小伙伴们点赞、关注！《------往期经典推荐------》一、AI应用软件开发实战专栏【链接】项目名称项目名称1.【人脸识别与管理系统开发】2.【车牌识别与自动收费管理系统开发】3.【手势识别系统开发】4.【人脸面部活体检测系统开发】5.【图片风格快速迁移软件开发】6.【人脸表表情识别系统】7.
谷歌浏览器ChromeDriver 128,129,130驱动下载下东西不要币多好 Python python
可以试试这个页面:https://googlechromelabs.github.io/chrome-for-testing/#stable我需要的128.0.6613.120就是在这里找到的,浏览器,驱动都能下
枚举的构造函数中抛出异常会怎样 bylijinnan java enum 单例
首先从使用enum实现单例说起。为什么要用enum来实现单例？这篇文章（ http://javarevisited.blogspot.sg/2012/07/why-enum-singleton-are-better-in-java.html）阐述了三个理由： 1.enum单例简单、容易，只需几行代码： public enum Singleton { INSTANCE;
CMake 教程 aigo C++
转自：http://xiang.lf.blog.163.com/blog/static/127733322201481114456136/ CMake是一个跨平台的程序构建工具，比如起自己编写Makefile方便很多。介绍：http://baike.baidu.com/view/1126160.htm 本文件不介绍CMake的基本语法，下面是篇不错的入门教程： http:
cvc-complex-type.2.3: Element 'beans' cannot have character Cb123456 spring Webgis
cvc-complex-type.2.3: Element 'beans' cannot have character Line 33 in XML document from ServletContext resource [/WEB-INF/backend-servlet.xml] is i
jquery实例:随页面滚动条滚动而自动加载内容 120153216 jquery
<script language="javascript"> $(function (){ var i = 4;$(window).bind("scroll", function (event){ //滚动条到网页头部的高度，兼容ie,ff,chrome var top = document.documentElement.s
将数据库中的数据转换成dbs文件何必如此 sql dbs
旗正规则引擎通过数据库配置器（DataBuilder）来管理数据库，无论是Oracle，还是其他主流的数据都支持，操作方式是一样的。旗正规则引擎的数据库配置器是用于编辑数据库结构信息以及管理数据库表数据，并且可以执行SQL 语句，主要功能如下。 1)数据库生成表结构信息：主要生成数据库配置文件(.conf文
在IBATIS中配置SQL语句的IN方式 357029540 ibatis
在使用IBATIS进行SQL语句配置查询时，我们一定会遇到通过IN查询的地方，在使用IN查询时我们可以有两种方式进行配置参数：String和List。具体使用方式如下： 1.String:定义一个String的参数userIds，把这个参数传入IBATIS的sql配置文件，sql语句就可以这样写： <select id="getForms" param
Spring3 MVC 笔记（一） 7454103 spring mvc bean REST JSF
自从 MVC 这个概念提出来之后 struts1.X struts2.X jsf 。。。。。这个view 层的技术一个接一个！都用过！不敢说哪个绝对的强悍！要看业务，和整体的设计！最近公司要求开发个新系统！
Timer与Spring Quartz 定时执行程序 darkranger spring bean 工作 quartz
有时候需要定时触发某一项任务。其实在jdk1.3，java sdk就通过java.util.Timer提供相应的功能。一个简单的例子说明如何使用，很简单： 1、第一步，我们需要建立一项任务，我们的任务需要继承java.util.TimerTask package com.test; import java.text.SimpleDateFormat; import java.util.Date;
大端小端转换，le32_to_cpu 和cpu_to_le32 aijuans C语言相关
大端小端转换，le32_to_cpu 和cpu_to_le32 字节序 http://oss.org.cn/kernel-book/ldd3/ch11s04.html 小心不要假设字节序. PC 存储多字节值是低字节为先(小端为先, 因此是小端), 一些高级的平台以另一种方式(大端)
Nginx负载均衡配置实例详解 avords
[导读] 负载均衡是我们大流量网站要做的一个东西，下面我来给大家介绍在Nginx服务器上进行负载均衡配置方法，希望对有需要的同学有所帮助哦。负载均衡先来简单了解一下什么是负载均衡，单从字面上的意思来理解就可以解负载均衡是我们大流量网站要做的一个东西，下面我来给大家介绍在Nginx服务器上进行负载均衡配置方法，希望对有需要的同学有所帮助哦。负载均衡先来简单了解一下什么是负载均衡
乱说的 houxinyou 框架敏捷开发软件测试
从很久以前，大家就研究框架，开发方法，软件工程，好多！反正我是搞不明白！这两天看好多人研究敏捷模型，瀑布模型！也没太搞明白. 不过感觉和程序开发语言差不多，瀑布就是顺序，敏捷就是循环. 瀑布就是需求、分析、设计、编码、测试一步一步走下来。而敏捷就是按摸块或者说迭代做个循环，第个循环中也一样是需求、分析、设计、编码、测试一步一步走下来。也可以把软件开发理
欣赏的价值——一个小故事 bijian1013 有效辅导欣赏欣赏的价值
　　第一次参加家长会，幼儿园的老师说："您的儿子有多动症，在板凳上连三分钟都坐不了，你最好带他去医院看一看。"　　回家的路上，儿子问她老师都说了些什么，她鼻子一酸，差点流下泪来。因为全班30位小朋友，惟有他表现最差；惟有对他，老师表现出不屑，然而她还在告诉她的儿子："老师表扬你了，说宝宝原来在板凳上坐不了一分钟，现在能坐三分钟。其他妈妈都非常羡慕妈妈，因为全班只有宝宝
包冲突问题的解决方法 bingyingao eclipse maven exclusions 包冲突
包冲突是开发过程中很常见的问题：其表现有： 1.明明在eclipse中能够索引到某个类，运行时却报出找不到类。 2.明明在eclipse中能够索引到某个类的方法，运行时却报出找不到方法。 3.类及方法都有，以正确编译成了.class文件，在本机跑的好好的，发到测试或者正式环境就抛如下异常： java.lang.NoClassDefFoundError: Could not in
【Spark七十五】Spark Streaming整合Flume-NG三之接入log4j bit1129 Stream
先来一段废话：实际工作中，业务系统的日志基本上是使用Log4j写入到日志文件中的，问题的关键之处在于业务日志的格式混乱，这给对日志文件中的日志进行统计分析带来了极大的困难，或者说，基本上无法进行分析，每个人写日志的习惯不同，导致日志行的格式五花八门，最后只能通过grep来查找特定的关键词缩小范围，但是在集群环境下，每个机器去grep一遍，分析一遍，这个效率如何可想之二，大好光阴都浪费在这上面了
sudoku solver in Haskell bookjovi sudoku haskell
这几天没太多的事做，想着用函数式语言来写点实用的程序，像fib和prime之类的就不想提了（就一行代码的事），写什么程序呢？在网上闲逛时发现sudoku游戏，sudoku十几年前就知道了，学生生涯时也想过用C/Java来实现个智能求解，但到最后往往没写成，主要是用C/Java写的话会很麻烦。现在写程序，本人总是有一种思维惯性，总是想把程序写的更紧凑，更精致，代码行数最少，所以现
java apache ftpClient bro_feng java
最近使用apache的ftpclient插件实现ftp下载，遇见几个问题，做如下总结。 1. 上传阻塞，一连串的上传，其中一个就阻塞了，或是用storeFile上传时返回false。查了点资料，说是FTP有主动模式和被动模式。将传出模式修改为被动模式ftp.enterLocalPassiveMode();然后就好了。看了网上相关介绍，对主动模式和被动模式区别还是比较的模糊，不太了解被动模
读《研磨设计模式》-代码笔记-工厂方法模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * 工厂方法模式：使一个类的实例化延迟到子类 * 某次，我在工作不知不觉中就用到了工厂方法模式（称为模板方法模式更恰当。2012-10-29）： * 有很多不同的产品，它
面试记录语 chenyu19891124 招聘
或许真的在一个平台上成长成什么样，都必须靠自己去努力。有了好的平台让自己展示，就该好好努力。今天是自己单独一次去面试别人，感觉有点小紧张，说话有点打结。在面试完后写面试情况表，下笔真的好难，尤其是要对面试人的情况说明真的好难。今天面试的是自己同事的同事，现在的这个同事要离职了，介绍了我现在这位同事以前的同事来面试。今天这位求职者面试的是配置管理，期初看了简历觉得应该很适合做配置管理，但是今天面
Fire Workflow 1.0正式版终于发布了 comsci 工作 workflow Google
Fire Workflow 是国内另外一款开源工作流，作者是著名的非也同志，哈哈.... 官方网站是 http://www.fireflow.org 经过大家努力,Fire Workflow 1.0正式版终于发布了正式版主要变化: 1、增加IWorkItem.jumpToEx(...)方法，取消了当前环节和目标环节必须在同一条执行线的限制，使得自由流更加自由 2、增加IT
Python向脚本传参 daizj python 脚本传参
如果想对python脚本传参数，python中对应的argc, argv(c语言的命令行参数)是什么呢？需要模块：sys 参数个数：len(sys.argv) 脚本名： sys.argv[0] 参数1： sys.argv[1] 参数2： sys.argv[
管理用户分组的命令gpasswd dongwei_6688 passwd
NAME： gpasswd - administer the /etc/group file SYNOPSIS： gpasswd group gpasswd -a user group gpasswd -d user group gpasswd -R group gpasswd -r group gpasswd [-A user,...] [-M user,...] g
郝斌老师数据结构课程笔记 dcj3sjt126com 数据结构与算法
<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<
yii2 cgridview加上选择框进行操作 dcj3sjt126com GridView
页面代码 <?=Html::beginForm(['controller/bulk'],'post');?> <?=Html::dropDownList('action','',[''=>'Mark selected as: ','c'=>'Confirmed','nc'=>'No Confirmed'],['class'=>'dropdown',])
linux mysql fypop linux
enquiry mysql version in centos linux yum list installed | grep mysql yum -y remove mysql-libs.x86_64 enquiry mysql version in yum repositoryyum list | grep mysql oryum -y list mysql* install mysq
Scramble String hcx2013 String
Given a string s1, we may represent it as a binary tree by partitioning it to two non-empty substrings recursively. Below is one possible representation of s1 = "great":
跟我学Shiro目录贴 jinnianshilongnian 跟我学shiro
历经三个月左右时间，《跟我学Shiro》系列教程已经完结，暂时没有需要补充的内容，因此生成PDF版供大家下载。最近项目比较紧，没有时间解答一些疑问，暂时无法回复一些问题，很抱歉，不过可以加群（334194438/348194195）一起讨论问题。 ----广告-----------------------------------------------------
nginx日志切割并使用flume-ng收集日志 liyonghui160com
nginx的日志文件没有rotate功能。如果你不处理，日志文件将变得越来越大，还好我们可以写一个nginx日志切割脚本来自动切割日志文件。第一步就是重命名日志文件，不用担心重命名后nginx找不到日志文件而丢失日志。在你未重新打开原名字的日志文件前，nginx还是会向你重命名的文件写日志，linux是靠文件描述符而不是文件名定位文件。第二步向nginx主
Oracle死锁解决方法 pda158 oracle
　select p.spid,c.object_name,b.session_id,b.oracle_username,b.os_user_name from v$process p,v$session a, v$locked_object b,all_objects c where p.addr=a.paddr and a.process=b.process and c.object_id=b.
java之List排序 shiguanghui list排序
在Java Collection Framework中定义的List实现有Vector，ArrayList和LinkedList。这些集合提供了对对象组的索引访问。他们提供了元素的添加与删除支持。然而，它们并没有内置的元素排序支持。　　你能够使用java.util.Collections类中的sort()方法对List元素进行排序。你既可以给方法传递
servlet单例多线程 utopialxw 单例多线程 servlet
转自http://www.cnblogs.com/yjhrem/articles/3160864.html 和 http://blog.chinaunix.net/uid-7374279-id-3687149.html Servlet 单例多线程 Servlet如何处理多个请求访问？Servlet容器默认是采用单实例多线程的方式处理多个请求的：1.当web服务器启动的