新缸中之脑

稳定扩散ControlNet v1.1 权威指南

ControlNet 是一种稳定扩散模型，可让你从参考图像中复制构图或人体姿势。

经验丰富的稳定扩散用户知道生成想要的确切成分有多难。图像有点随机。你所能做的就是玩数字游戏：生成大量图像并选择你喜欢的图片。

借助 ControlNet，稳定扩散用户终于有了一种精确控制拍摄对象位置和外观的方法！

在这篇文章中，我们将介绍有关ControlNet的所有信息。

推荐：用 NSDT编辑器快速搭建可编程3D场景

1、什么是ControlNet?

ControlNet是用于控制稳定扩散模型的神经网络模型。你可以将 ControlNet 与任何稳定扩散模型一起使用。

使用稳定扩散模型的最基本形式是文本到图像。它使用文本提示作为条件来引导图像生成，以便生成与文本提示匹配的图像。

ControlNet 除了文本提示之外，还增加了一个条件。额外的调节可以在ControlNet中采取多种形式。

让我向你展示ControlNet可以执行的操作的两个示例：使用（1）边缘检测和（2）人体姿势检测来控制图像生成。

1.1 ControlNet边缘检测示例

如下图所示，ControlNet 获取额外的输入图像并使用 Canny 边缘检测器检测其轮廓。然后，包含检测到的边缘的图像将另存为控制图。它作为文本提示的额外条件馈送到 ControlNet 模型中。

具有边缘检测的稳定扩散控制网络

从输入图像中提取特定信息（在本例中为边缘）的过程称为注解（在这篇研究文章中）或预处理（在ControlNet扩展中）。

1.2 ControlNet人体姿势检测示例

边缘检测不是预处理图像的唯一方法。Openpose 是一种快速的人类关键点检测模型，可以提取人类姿势，如手、腿和头部的位置。请参阅下面的示例。

使用Openpose进行人体姿势检测的带注解的输入图像

下面是使用 OpenPose 的 ControlNet 工作流程。使用OpenPose从输入图像中提取关键点，并将其保存为包含关键点位置的控制图。然后，它与文本提示一起作为额外的条件被馈送到稳定扩散。图像是基于这两个条件生成的。

使用Canny边缘检测和Openpose有什么区别？Canny边缘检测器可以提取主体和背景的边缘。它倾向于更忠实地翻译场景。你可以看到跳舞的男人变成了女人，但轮廓和发型被保留了下来。

OpenPose仅检测人类的关键点，例如头部，手臂等的位置。图像生成更加自由，但遵循原始姿势。

上面的示例生成了一个女人跳起来，左脚指向侧面，与原始图像和 Canny Edge 示例中的图像不同。原因是OpenPose的关键点检测没有指定脚的方向。

2、安装稳定扩散ControlNet

让我们来看看如何在 AUTOMATIC1111 中安装 ControlNet，这是一款流行且功能齐全（且免费！稳定的扩散图形用户界面。我们将使用此扩展（事实上的标准）来使用 ControlNet。

如果你已经安装了 ControlNet，则可以跳到下一部分以了解如何使用它。

2.1 在Colab中安装ControlNet

在我们的快速入门指南中，将 ControlNet 与一键式稳定扩散 Colab 笔记本一起使用很容易。

在 Colab 笔记本的“扩展”部分中，选中“ControlNet”。

按Play按钮启动AUTOMATIC1111。就是这样！

2.2 安装 ControlNet 扩展（Windows/Mac）

你也可以在 Windows PC 或 Mac 上将 ControlNet 与 AUTOMATIC1111 配合使用。按照这些文章中的说明安装 AUTOMATIC1111（如果尚未这样做）。

如果已经安装了 AUTOMATIC1111，请确保你的副本是最新的。

导航到“扩展”页面。
选择“从 URL 安装”选项卡。
将以下 URL 放在扩展的存储库字段的 URL 中：

https://github.com/Mikubill/sd-webui-controlnet

单击安装按钮。
等待确认消息，说明扩展已安装。
重新启动AUTOMATIC1111。
访问ControlNet模型页面。
下载所有模型文件（文件名以 .pth 结尾）。如果不想全部下载，可以立即下载最常用的openpose和canny模型。
将模型文件放入 ControlNet 扩展的模型目录中：

stable-diffusion-webui\extensionssd-webui-controlnet\models

重新启动AUTOMATIC1111 webui。

如果扩展成功安装，你将在 txt2img 选项卡中看到一个名为 ControlNet 的新可折叠部分。它应该在脚本下拉菜单的正上方。

这表示扩展安装成功。

3、安装 T2I 适配器

T2I 适配器是神经网络模型，用于为扩散模型的图像生成提供额外的控制。它们在概念上类似于ControlNet，但设计不同。

A1111 控制网扩展可以使用 T2I 适配器。你需要在此处下载模型。获取文件名读起来像 t2iadapter_XXXXX.pth 的那些

许多 T2I 适配器的功能与 ControlNet 型号重叠。我只介绍以下两个。

t2iadapter_color_sd14v1.pth
t2iadapter_style_sd14v1.pth

将它们放在 ControlNet 的模型文件夹中。

stable-diffusion-webui\extensions\sd-webui-controlnet\models

4、更新 ControlNet 扩展

ControlNet是一个经历了快速发展的扩展。发现你的 ControlNet 副本已过时的情况并不少见。

仅当你在 Windows 或 Mac 上本地运行 AUTOMATIC1111 时，才需要更新。网站的Colab笔记本始终运行最新的ControlNet扩展。

要确定你的 ControlNet 版本是否为最新版本，请将 txt2img 页面上“ControlNet”部分中的版本号与最新版本号进行比较。

4.1 选项 1：从 Web UI 更新

更新 ControlNet 扩展的最简单方法是使用 AUTOMATIC1111 GUI。

转到“扩展”页面。
在“已安装”选项卡中，单击“检查更新”。
等待确认消息。
完全关闭并重新启动AUTOMATIC1111 Web UI。

4.2 选项 2：命令行

如果你熟悉命令行，则可以使用此选项更新 ControlNet，这样你就可以放心，Web-UI 不会执行其他操作。

步骤1：打开终端应用程序（Mac）或PowerShell应用程序（Windows）。

第 2 步：导航到 ControlNet 扩展的文件夹。（如果安装在其他地方，请相应地调整）

cd stable-diffusion-webui/extensions/sd-webui-controlnet

步骤 3：通过运行以下命令更新扩展。

git pull

5、使用 ControlNet的简单例子

现在你已经安装了 ControlNet，让我们通过一个简单的使用它的示例！稍后你将看到每个设置的详细说明。

你应该安装ControlNet扩展以跟上本节的内容。可以通过查看下面的控制网络部分进行验证。

按右侧的插入符号展开“ControlNet”面板。它显示了控制旋钮的完整部分和图像上传画布。

我将使用下图展示如何使用 ControlNet。你可以点击这里下载按钮下载图像以按照教程进行操作。

5.1 文本到图像设置

ControlNet需要与稳定扩散模型一起使用。在稳定扩散检查点下拉菜单中，选择要与 ControlNet 一起使用的模型。选择 v1-5-pruned-emaonly.ckpt 以使用 v1.5 基本模型。

在 txt2image 选项卡中，编写提示和（可选）供 ControlNet 使用的否定提示。我将使用以下提示。

提示：

full-body, a young female, highlights in hair, dancing outside a restaurant, brown eyes, wearing jeans

负面提示：

disfigured, ugly, bad, immature

设置图像生成的图像大小。我将使用宽度 512 和高度 776 作为我的演示图像。请注意，图像大小是在 txt2img 部分中设置的，而不是在 ControlNet 部分中设置的。

GUI 应如下所示。

5.2 ControlNet设置

现在让我们转到“ControlNet”面板。

首先，将图像上传到图像画布。

选中启用复选框。

你需要选择预处理器和模型。预处理器只是前面提到的注释器的不同名称，例如 OpenPose 关键点检测器。让我们选择 openpose 作为预处理器。

选定的 ControlNet 模型必须与预处理器一致。对于OpenPose，应该选择control_openpose-fp16作为模型。

“ControlNet”面板应如下所示。

就这样。现在按生成开始使用控制网络生成图像。

你应该会看到生成的图像以遵循输入图像的姿势。最后一个图像直接来自预处理步骤。在这种情况下，它是检测到的关键点。

完成后，取消选中启用复选框以禁用 ControlNet 扩展。

这是使用ControlNet的基础知识！

剩下的就是要理解：

有哪些预处理器可用（有很多！）
控制网设置

6、预处理器和模型

使用 ControlNet 的第一步是选择预处理器。打开预览很有帮助，以便你知道预处理器正在做什么。预处理完成后，原始图像将被丢弃，只有预处理后的图像将用于 ControlNet。

要打开预览：

选择允许预览。
（可选）选择像素完美。ControlNet 将使用你在文本到图像中指定的图像高度和宽度来生成预处理的图像。
单击预处理器下拉菜单旁边的爆炸图标。

某些控制模型可能会对图像产生太大影响。如果看到颜色问题或其他伪影，请减小控制权重。

6.1 选择正确的模型

选择预处理器后，必须选择正确的模型。

很容易判断哪个模型是在 v1.1 中使用的正确模型。你需要做的就是选择与预处理器具有相同起始关键字的模型。

例如：

预处理器	模型
depth_xxxx	control_xxxx_depth
lineart_xxxx	control_xxxx_lineart
openpose_xxxx	control_xxxx_openpose

6.2 OpenPose预处理器

有多个 OpenPose 预处理器。

OpenPose检测人类的关键点，例如头部，肩膀，手的位置等。它可用于复制人类姿势而无需复制服装、发型和背景等其他细节。

所有 openpose 预处理器都需要与 ControlNet 的 Model 下拉菜单中的 openpose 模型一起使用。

OpenPose 预处理器包括：

OpenPose：眼睛、鼻子、眼睛、颈部、肩膀、肘部、手腕、膝盖和脚踝。
OpenPose_face：OpenPose+面部细节
OpenPose_hand：OpenPose+手和手指
OpenPose_faceonly：仅面部细节
OpenPose_full：以上所有内容
dw_openPose_full：OpenPose_full的增强版本

OpenPose是基本的OpenPose预处理器，可检测眼睛，鼻子，眼睛，颈部，肩部，肘部，手腕，膝盖和脚踝的位置。

OpenPose_face执行OpenPose处理器所做的一切，但会检测到其他面部细节。

它对于复制面部表情很有用。

OpenPose 人脸仅检测人脸，而不检测其他关键点。这对于仅复制人脸而不适用于其他关键点。

OpenPose_hand检测关键点为 OpenPose 以及手和手指。

OpenPose full检测所有openPose面部和openPose手所做的一切。

DWPose是一种基于研究文章两阶段蒸馏的有效全身姿势估计的新姿势检测算法。它完成了与OpenPose Full相同的任务，但做得更好。应该使用dw_openpose_full而不是openpose_full。

如果在预处理器菜单中看不到dw_openpose_full，请更新 ControlNet。

DW OpenPose在检测手和手指方面做得更好。

6.3 切片重采样

切片重采样（tile resample）模型用于向图像添加细节。它通常与升频器一起使用以同时放大图像。

请参阅ControlNet Tile Scaling方法。

6.4 引用预处理器

引用（reference）是一组新的预处理器，可用于生成与引用图像类似的图像。图像仍将受到稳定扩散模型和提示的影响。

引用预处理器不使用控制模型。你只需要选择预处理器，而不需要选择模型。实际上，选择参考预处理器后，模型下拉菜单将被隐藏。

有 3 个引用预处理器。

reference adain：通过自适应实例规范化进行样式迁移。论文
reference only：将引用图像直接链接到注意层。
reference adain+attn：上述组合。

选择其中一个要使用的预处理器。

下面是一个示例。

引用图像

使用 CLIP 询问器猜测提示。

a woman with pink hair and a robot suit on, with a sci – fi, Artgerm, cyberpunk style, cyberpunk art, retrofuturism

负向提示：

disfigured, ugly, bad, immature

模型：Protogen v2.2

Reference adain：

Reference only：

Reference adain + attn：

我会说，Reference only的效果最好。

以上图片均来自平衡模式。我认为改变样式保真度没有太大区别。

6.5 Canny边缘检测器

Canny的边缘检测器是一种通用的老式边缘检测器。它提取图像的轮廓。它对于保留原始图像的构图很有用。

在预处理器和模型下拉菜单中选择canny。

生成的图像将遵循轮廓。

6.6 深度预处理器

深度预处理器从参考图像中猜测深度信息。

Depth Midas：经典的深度估算器。也用于官方 v2 图像深度模型。
Depth：更多细节，但也倾向于渲染背景。
Depth Leres++：更多细节。
Zoe：细节水平介于迈达斯和莱雷斯之间。

参考图片：

深度图：

提示：

a woman retrofuturism
否定提示：

disfigured, ugly, bad, immature

可以看到生成的图像遵循深度图（Zoe）。

与更详细的 Leres++ 进行比较：

6.7 线条艺术

艺术线条（Line Art）渲染图像的轮廓。它尝试将其转换为简单的绘图。

有一些线条艺术预处理器。

线条艺术动漫：动漫风格的线条
线条艺术动漫降噪：细节较少的动漫风格线条。
线条艺术逼真：写实风格的线条。
线条艺术粗糙：具有较重重量的逼真风格的线条。

与艺术线条控制模型一起使用。

下面的图像是在控制权重设置为 0.7 的情况下生成的。

线条艺术动漫

线条艺术动漫降噪

线条艺术逼真：

线条艺术粗糙：

6.8 MLSD

M-LSD（移动线段检测）是一种直线检测器。它可用于提取具有直边的轮廓，如室内设计、建筑物、街景、相框和纸边。

曲线将被忽略。

6.9 法线贴图

法线贴图指定曲面的方向。对于 ControlNet，它是一个图像，用于指定每个像素所在的表面的方向。图像像素表示表面朝向的方向，而不是颜色值。

法线贴图的使用与深度贴图类似。它们用于传输参考图像的 3D 构图。

法线贴图预处理器：

Normal Midas：根据迈达斯深度图估计法线贴图。
Normal Bae：使用裴等人提出的正态不确定性方法估计法态图。

与迈达斯深度贴图一样，迈达斯法线贴图也非常适合将主体与背景隔离开来。

Bae 法线贴图倾向于在背景和前景中渲染细节。

6.10 涂鸦

涂鸦（Scribble）预处理器将图片变成涂鸦，就像手绘一样。

Scribble HED：整体嵌套边缘检测（HED）是一种边缘检测器，擅长像真人一样生成轮廓。根据ControlNet的作者的说法，HED适用于重新着色和重新设计图像。
Scribble Pidinet：像素差分网络（Pidinet）检测曲线和直边。它的结果类似于HED，但通常会导致线条更清晰，细节更少。
Scribble xdog：高斯差异（XDoG）是一种边缘检测方法技术。调整 xDoG 阈值并观察预处理器输出非常重要。

所有这些预处理器都应与scribble控制模型一起使用。

Scribble HED产生粗略的涂鸦线。

Scribble Pidinet倾向于产生几乎没有细节的粗线条。它适用于复制没有精细细节的电路板轮廓。

通过调整 Scribble XDoG 阈值可以控制细节级别，使 xDoG 成为创建涂鸦的多功能预处理器。

6.11 分割预处理器

分割（segment）预处理器标记参考图像中的对象类型。

下面是一个正在运行的分割处理器。

建筑物、天空、树木、人物和人行道都标有不同的预定义颜色。

可以在这里的 ufade20k 和 ofade20k 的颜色图中找到对象类别和颜色。

有几个细分选项

ufade20k：在ADE20K数据集上训练的UniFormer （uf）分割。
ofade20k：在ADE20k数据集上训练的OneFormer （of）分割。
ofcoco：在COCO数据集上训练的前者分割。

请注意，ADE20k和COCO分割的色彩图是不同的。

可以使用分割预处理器来传输对象的位置和形状。

下面使用这些预处理器具有相同的提示和种子。

Futuristic city, tree, buildings, cyberpunk

UniFormer ADE20k （ufade20k）在此示例中准确标记所有内容。

OneFormer ADE20k （ofade20k）在这种情况下噪点更大一些，但不会影响最终图像。

OneFormer COCO （ofcoco）的表现类似，但有一些标签错误。

分割是一种强大的技术。你可以进一步操作分割贴图以将对象放置在精确位置。使用 ADE20k 的色彩图。

6.12 随机播放

随机播放（Shuffle）预处理器搅动输入图像。让我们看看实际效果。

与随机播放控制模型一起，随机播放预处理器可用于传输参考图像的配色方案。

输入图像：

随机播放预处理器：

与其他预处理器不同，随机预处理器是随机的。它将受到你的种子值的影响。

将随机预处理器与随机播放控制模型一起使用。随机控制模型可以与随机预处理器一起使用，也可以不使用随机播放预处理器。

下图是 ControlNet Shuffle 预处理器和 Shuffle 模型（与上一节的提示相同）。配色方案大致遵循参考图像。

下图仅包含 ControlNet Shuffle 模型（预处理器：无）。图像构图更接近原始图像。配色方案类似于洗牌。

下图具有相同的提示，没有 ControlNet。配色方案截然不同。

6.13 颜色栅格T2I 适配器

颜色栅格 T2i 适配器预处理器将参考图像缩小到 64 倍，然后将其扩展回原始大小。净效果是局部平均颜色的网格状斑块。

原始参考图像：

使用t2ia_color_grid进行预处理：

然后，可以将预处理的图像与 T2I 颜色适配器（t2iadapter_color）控制模型一起使用。

图像生成将在空间上松散地遵循配色方案。

A modern living room

增加 ControlNet 权重以使其更紧密地跟踪。

还可以对此 T2I 颜色模型使用预处理器 None 。

在我看来，它与图像到图像非常相似。

6.14 Clip vision style T2I 适配器

t2ia_style_clipvision将参考图像转换为 CLIP 视觉嵌入。此嵌入包含有关图像内容和样式的丰富信息。

你将需要使用控制模型t2iadapter_style_XXXX。

看看这个惊人的风格转换的效果：

参考图片：

T2I adapter – CLIP vision:

sci-fi girl

以下是关闭控制网时此提示将生成的内容。

该功能与参考控制网非常相似，但我认为T2IA CLIP Vision更强大。

6.15 ControlNet InPainting

ControlNet InPainting允许在Inpainting中使用高降噪强度来生成较大的变化，而不会牺牲与整个图像的一致性。

例如，我对现实的人使用了提示。

模型： HenmixReal v4

photo of young woman, highlight hair, sitting outside restaurant, wearing dress, rim lighting, studio lighting, looking at the camera, dslr, ultra quality, sharp focus, tack sharp, dof, film grain, Fujifilm XT3, crystal clear, 8K UHD, highly detailed glossy eyes, high detailed skin, skin pores

否定提示：

disfigured, ugly, bad, immature, cartoon, anime, 3d, painting, b&w

我有这个图像，想用InPainting来重新生成面部。

如果我用高去噪强度（> 0.4）在脸上涂漆，结果可能会在全局范围内不一致。以下是具有去噪强度1的未上色图像：

ControlNet Inpainting是解决方案。

要使用 ControlNet 修复，请执行以下操作：

1、最好使用生成图像的同一模型。在 txt2img 页面上生成图像后，单击“发送到 Inpaint”，将图像发送到 Img2img 页面上的 Inpaint 选项卡。

2、使用画笔工具在要再生的区域上创建蒙版。如果不熟悉，请参阅有关Inpainting的初学者教程。

3、将“上色区域”设置为“仅蒙版”。（整个图片也有效）

4、将降噪强度设置为 1。如果没有 ControlNet，你通常不会将其设置得这么高。

5、在“ControlNet”部分中设置以下参数。无需上传参考图片。

启用：是
预处理器：Inpaint_global_harmonious
模型： ControlNet

6、按生成开始修复。

现在，即使在最大降噪强度（1）下，我也能获得与全局形象一致的新面孔！

目前，有3个inpainting预处理器

Inpaint_global_harmonious：提高全局一致性，并允许你使用高降噪强度。
Inpaint_only：不会更改未遮罩的区域。它与 AUTOMATIC1111 中
Inpaint_global_harmonious相同。
Inpaint_only+lama：用lama模型处理图像。它往往会产生更干净的结果，并且有利于对象删除。

7、ControlNet设置完整说明

你在 ControlNet 扩展中看到了很多设置！当第一次使用它时，它可能有点吓人，但让我们一一介绍它们。

这将是一次深入的潜水。休息一下，如果需要的话去洗手间…

7.1 输入控制

图像画布：你可以将输入图像拖放到此处。也可以单击画布并使用文件浏览器选择一个文件。输入图像将由预处理器下拉菜单中的选定预处理器进行处理。将创建一个控制图。
写入图标：使用白色图像创建新画布，而不是上传参考图像。它用于直接创建涂鸦。
相机图标：使用设备的相机拍照并将其用作输入图像。你需要向浏览器授予访问相机的权限。

7.2 模型选择

启用：是否启用 ControlNet。
低 VRAM：适用于 VRAM 小于 8GB 的 GPU。这是一个实验性功能。检查 GPU 内存是否不足，或者是否要增加处理的图像数量。
允许预览：选中此选项以启用参考图像旁边的预览窗口。我建议您选择此选项。使用预处理器下拉菜单旁边的分解图标预览预处理器的效果。
预处理器：预处理器（在研究文章中称为注释器），用于预处理输入图像，例如检测边缘、深度和法线贴图。均不使用输入图像作为控制图。
模型：要使用的控制网络模型。如果选择了预处理器，通常会选择相应的模型。ControlNet 模型与在 AUTOMATIC1111 GUI 顶部选择的稳定扩散模型一起使用。

7.3 控制权重

在预处理器和模型下拉菜单下方，你将看到三个滑动条，可用于控制效果：控制权重、开始和结束控制步骤。

我将使用以下图像来说明控制权重的效果。这是一个女孩坐下来的形象。

但是在提示中，我会要求生成一个站起来的女人。

full body, a young female, highlights in hair, standing outside restaurant, blue eyes, wearing a dress, side light

权重：相对于提示给予控件映射的强调程度。它类似于提示中的关键字权重，但适用于控件映射。

以下图像是使用 ControlNet OpenPose 预处理器和 OpenPose 模型生成的。

如你所见，Controlnet 权重控制相对于提示遵循的控制映射的程度。权重越低，ControlNet 对图像遵循控制图的要求就越少。

启动 ControlNet 步骤：首先应用步骤 ControlNet。0 表示第一步。

结束控制网步骤：步骤控制网结束。1 表示最后一步。

让我们修复固定为 0 的起始步骤，并更改结束 ControlNet 步骤以查看会发生什么。

由于初始步骤设置了全局组合（采样器在每个步骤中去除了最大数量的噪声，并且它从潜在空间中的随机张量开始），因此即使你仅将 ControlNet 应用于前采样步骤的 20%，也会设置姿势。

相反，更改结束 ControlNet 步骤的效果较小，因为全局组合是在开始步骤中设置的。

7.4 控制模式

平衡：控制网适用于采样步骤中的调节和非调节。这是标准操作模式。
我的提示更重要：ControlNet 的效果在 U-Net 注入实例中逐渐降低（一个采样步骤中有 13 个）。最终效果是你的提示比控制网络具有更大的影响力。
ControlNet 更重要：在解除调节时关闭 ControlNet。实际上，CFG量表还可以作为控制网效果的乘数。

如果你不完全了解它们的实际工作原理，请不要担心。选项标签准确说明效果。

7.5 调整大小模式

调整大小模式控制当输入图像或控制图的大小与要生成的图像的大小不同时要执行的操作。如果这些选项具有相同的纵横比，则无需担心它们。

我将通过设置文本到图像来生成横向图像来演示调整大小模式的效果，而输入图像/控制地图是纵向图像。

只需调整大小：独立缩放控件映射的宽度和高度以适合图像画布。这将更改控件映射的纵横比。

女孩现在需要向前倾，这样她才能仍然在画布内。你可以使用此模式创建一些有趣的效果。

裁剪和调整大小：使图像画布适合控制图。裁剪控件映射，使其与画布大小相同。

因为控制地图在顶部和底部被裁剪，所以我们的女孩也是如此。

调整大小和填充：使整个控件映射适合图像画布。使用空值扩展控件映射，使其与图像画布的大小相同。

与原始输入图像相比，侧面有更多的空间。

现在（希望）你知道所有设置。让我们探讨一些使用 ControlNet 的想法。

8、多个ControlNet

你可以多次使用 ControlNet 来生成图像。让我们来看一个例子。

模型: Protogen v2.2

提示：

An astronaut sitting, alien planet

否定提示：

disfigured, deformed, ugly

此提示会生成具有各种构图的图像。

假设我想独立控制宇航员和背景的构图。为此，我们可以使用多个（在本例中为 2 个）控制网。

我将使用此参考图像来固定宇航员的姿势。

ControlNet 0 的设置：

启用：是
预处理器：OpenPose
模型： control_xxxx_openpose
调整大小模式：调整大小和重新填充（因为我的原始参考图像是纵向的）

我将使用以下参考图像作为背景。

深度模型非常适合此目的。

ControlNet 1 的設定：

启用：是
控制权重：0.45
预处理器：depth_zeo
模型： control_XXXX_depth
调整大小模式：裁剪和调整大小

现在我可以独立控制主体和背景的构图：

技巧：

调整 ControlNet 权重，如果其中一个没有完成其工作。
如果有最终图像不同大小的参考图像，请注意调整大小模式。

9、模仿人体姿势

也许ControlNet最常见的应用是复制人类的姿势。这是因为通常很难控制姿势…直到现在！输入图像可以是稳定扩散生成的图像，也可以是从真实相机拍摄的图像。

要使用 ControlNet 传输人体姿势，请按照说明在 AUTOMATIC1111 中启用 ControlNet。使用以下设置。

预处理器：openpose
模型： control_…_openpose
确保已选中启用。

以下是一些示例。

9.1 示例 1：从图像复制姿势

作为基本示例，让我们复制以下欣赏树叶的女人图像的姿势。

使用各种模型和提示，你可以显著地更改内容，但保持姿势。

9.2 示例 2：重新混合影片场景

你可以将Pulp Fiction中的标志性舞蹈场景重新塑造为公园中的一些瑜伽练习。

这使用带有DreamShaper模型的ControlNet。

这是相同的提示，但使用墨水朋克扩散模型。你需要在提示中添加激活关键字 nvinkpunk：

10、使用 ControlNet 对图像进行风格化处理

下面是v1.5模型，但各种提示实现不同的风格。使用了具有各种预处理的ControlNet。最好进行实验，看看哪一个效果最好。

你还可以使用模型对图像进行样式化。下面是使用提示“贝多芬的绘画”与Anythingv3，DreamShaper和OpenJourney模型生成的。

11、使用魔术姿势控制姿势

有时，你可能无法找到具有所需确切姿势的图像。可以使用魔术姿势等软件工具创建自定义姿势。

第 1 步：转到魔术姿势网站。

第2步：移动模型的关键点以自定义姿势。

第 3 步：按预览。截取模型的屏幕截图。应该得到如下所示的图像。

第 4 步：使用 OpenPose ControlNet 模型。选择你选择的模型和提示以生成图像。

以下是使用1.5模型和DreamShaper模型生成的一些图像。在所有情况下，姿势都复制得很好。

12、室内设计思路

可以使用稳定扩散控制网的直线探测器MLSD模型来生成室内设计思路。以下是ControlNet设置。

预处理器：mlsd
模型： MLSD

从任何室内设计照片开始。让我们以下面的一个为例。

提示：

award winning living room

模型：Stable Diffusion v1.5

以下是一些产生的设计思路。

或者，你可以使用深度模型。它将强调保留深度信息，而不是直线。

预处理器：Depth Midas
模型：Depth

生成的图像：

13、稳定扩散深度模型与ControlNet的区别

稳定扩散的创建者Stability AI发布了一个深度图像模型。它与ControlNet有很多相似之处，但存在重要差异。

让我们先谈谈相似之处。

它们都是稳定扩散模型…
它们都使用两种条件（预处理的图像和文本提示）。
他们都使用MiDAS来估计深度图。

区别在于：

图像深度模型是 v2 模型。ControlNet 可用于任何 v1 或 v2 模型。这一点很重要，因为 v2 模型是出了名的难以使用。人们很难产生好的形象。ControlNet 可以使用任何 v1 模型的事实不仅为 v1.5 基础模型开放了深度调节，而且还为社区发布的数千种特殊模型开放了条件反射。
ControlNet更加通用。除了深度之外，它还可以通过边缘检测、姿势检测等进行调节。
ControlNet的深度图具有比图像深度更高的分辨率。

14、ControlNet如何工作？

如果不解释 ControlNet 在后台的工作原理，本教程将是不完整的。

ControlNet 的工作原理是将可训练的网络模块附加到稳定扩散模型的 U-Net（噪声预测器）的各个部分。稳定扩散模型的权重被锁定，以便在训练期间保持不变。在训练期间仅修改附加的模块。

研究论文中的模型图很好地总结了这一点。最初，附加网络模块的权重全部为零，使新模型能够利用经过训练和锁定的模型。

在训练期间，每个训练图像一起提供两个条件：（1）文本提示，以及（2）控制映射，例如 OpenPose 关键点或 Canny 边缘。ControlNet 模型学习基于这两个输入生成图像。

每个控制方法都是独立训练的。

原文链接：ControlNet v1.1权威指南 — BimAnt

你可能感兴趣的:(计算机视觉,人工智能)

算法学习笔记：17.蒙特卡洛算法 ——从原理到实战，涵盖 LeetCode 与考研 408 例题
在计算机科学和数学领域，蒙特卡洛算法（MonteCarloAlgorithm）以其独特的随机抽样思想，成为解决复杂问题的有力工具。从圆周率的计算到金融风险评估，从物理模拟到人工智能，蒙特卡洛算法都发挥着不可替代的作用。本文将深入剖析蒙特卡洛算法的思想、解题思路，结合实际应用场景与Java代码实现，并融入考研408的相关考点，穿插图片辅助理解，帮助你全面掌握这一重要算法。蒙特卡洛算法的基本概念蒙特卡
霍夫变换（Hough Transform）算法原来详解和纯C++代码实现以及OpenCV中的使用示例点云SLAM 算法图形图像处理算法 opencv 图像处理与计算机视觉算法直线提取检测目标检测霍夫变换算法
霍夫变换（HoughTransform）是一种经典的图像处理与计算机视觉算法，广泛用于检测图像中的几何形状，例如直线、圆、椭圆等。其核心思想是将图像空间中的“点”映射到参数空间中的“曲线”，从而将形状检测问题转化为参数空间中的峰值检测问题。一、霍夫变换基本思想输入：边缘图像（如经过Canny边缘检测）输出：一组满足几何模型的形状（如直线、圆）关键思想：图像空间中的一个点→参数空间中的一个曲线参数空
AI音乐模拟器：AIGC时代的智能音乐创作革命 lauo 人工智能 AIGC 开源前端机器人
AI音乐模拟器：AIGC时代的智能音乐创作革命引言：AIGC浪潮下的音乐创作新范式在数字化转型的浪潮中，人工智能生成内容（AIGC）正在重塑各个创意领域。音乐产业作为创意经济的重要组成部分，正经历着前所未有的变革。据最新市场研究数据显示，全球AI音乐市场规模预计将从2023年的5.8亿美元增长到2030年的26.8亿美元，年复合增长率高达24.3%。这一快速增长的市场背后，是AI音乐技术正在打破传
视频分析：让AI看懂动态画面随机森林404 计算机视觉音视频人工智能 microsoft
引言：动态视觉理解的革命在数字信息爆炸的时代，视频已成为最主要的媒介形式。据统计，每分钟有超过500小时的视频内容被上传到YouTube平台，而全球互联网流量的82%来自视频数据传输。面对如此海量的视频内容，传统的人工处理方式已无法满足需求，这正是人工智能视频分析技术大显身手的舞台。视频分析技术赋予机器"看懂"动态画面的能力，使其能够自动理解、解释甚至预测视频中的内容，这一突破正在彻底改变我们与视
目标检测（object detection）加油吧zkf 目标检测目标检测人工智能计算机视觉
目标检测作为计算机视觉的核心技术，在自动驾驶、安防监控、医疗影像等领域发挥着不可替代的作用。本文将系统讲解目标检测的概念、原理、主流模型、常见数据集及应用场景，帮助读者构建对这一技术的完整认知。一、目标检测的核心概念目标检测（ObjectDetection）是指在图像或视频中自动定位并识别出所有感兴趣的目标的技术。它需要解决两个核心问题：分类（Classification）：确定图像中每个目标的类
法律科技领域人工智能代理构建的十个经验教训，一位人工智能工程师通过构建、部署和维护智能代理的经验教训来优化法律工作流程的历程。知识大胖 NVIDIA GPU和大语言模型开发教程人工智能 ai
目录介绍什么是代理人？为什么它对法律如此重要？法律技术中代理用例示例-合同审查代理-法律研究代理在LegalTech中使用代理的十个教训-教训1：即使代理很酷，它们也不能解决所有问题-教训2：选择最适合您用例的框架-教训3：能够快速迭代不同的模型-教训4：从简单开始，必要时扩展-教训5：使用跟踪解决方案；您将需要它-教训6：确保跟踪成本，代理循环可能很昂贵-教训7：将控制权交给最终用户（人在环路中
Llama-Omni会说话的人工智能“语音到语音LLM” 利用低延迟、高质量语音转语音 AI 彻底改变对话方式（教程含源码）知识大胖 NVIDIA GPU和大语言模型开发教程 llama 人工智能 nvidia llm
介绍“单靠技术是不够的——技术与文科、人文学科的结合，才能产生让我们心花怒放的成果。”——史蒂夫·乔布斯近年来，人机交互领域发生了重大变化，尤其是随着ChatGPT、GPT-4等大型语言模型(LLM)的出现。虽然这些模型主要基于文本，但人们对语音交互的兴趣日益浓厚，以使人机对话更加无缝和自然。然而，实现语音交互而不受语音转文本处理中常见的延迟和错误的影响仍然是一个挑战。关键字：Llama-Omni
什么是热力学计算？它如何帮助人工智能发展？知识大胖 NVIDIA GPU和大语言模型开发教程人工智能量子计算
现代计算的基础是晶体管，这是一种微型电子开关，可以用它构建逻辑门，从而创建CPU或GPU等复杂的数字电路。随着技术的进步，晶体管变得越来越小。根据摩尔定律，集成电路中晶体管的数量大约每两年增加一倍。这种指数级增长使得计算技术呈指数级发展。然而，晶体管尺寸的缩小是有限度的。我们很快就会达到晶体管无法工作的阈值。此外，人工智能的进步使得对计算能力的需求比以往任何时候都更加迫切。根本问题是自然是随机的（
上海交大：工具增强推理agent
标题：SciMaster:TowardsGeneral-PurposeScientificAIAgentsPartI.X-MasterasFoundation-CanWeLeadonHumanity’sLastExam?来源：arXiv,2507.05241摘要人工智能代理的快速发展激发了利用它们加速科学发现的长期雄心。实现这一目标需要深入了解人类知识的前沿。因此，人类的最后一次考试（HLE）为评
微算法科技的前沿探索：量子机器学习算法在视觉任务中的革新应用 MicroTech2025 量子计算算法
在信息技术飞速发展的今天，计算机视觉作为人工智能领域的重要分支，正逐步渗透到我们生活的方方面面。从自动驾驶到人脸识别，从医疗影像分析到安防监控，计算机视觉技术展现了巨大的应用潜力。然而，随着视觉任务复杂度的不断提升，传统机器学习算法在处理大规模、高维度数据时遇到了计算瓶颈。在此背景下，量子计算作为一种颠覆性的计算模式，以其独特的并行处理能力和指数级增长的计算空间，为解决这一难题提供了新的思路。微算
中国银联豪掷1亿采购海光C86架构服务器信创新态势海光芯片 C86 国产芯片海光信息
近日，中国银联国产服务器采购大单正式敲定，基于海光C86架构的服务器产品中标，项目金额超过1亿元。接下来，C86服务器将用于支撑中国银联的虚拟化、大数据、人工智能、研发测试等技术场景，进一步提升其业务处理能力、用户服务效率和信息安全水平。作为我国重要的银行卡组织和金融基础设施，中国银联在全球183个国家和地区设有银联受理网络，境内外成员机构超过2600家，是世界三大银行卡品牌之一。此次中国银联发力
AI人工智能浪潮中文心一言的独特优势
AI人工智能浪潮中文心一言的独特优势：为什么它是中国市场的“AI主力军”？关键词：文心一言,AI大模型,中文处理,多模态融合,产业落地,安全可控,百度ERNIE摘要：在全球AI大模型浪潮中，百度文心一言（ERNIEBot）凭借“懂中文、会多模态、能落地、守规矩”的四大核心优势，成为中国市场最具竞争力的AI产品之一。本文将用“超级大脑”的比喻，从中文理解、多模态能力、产业生态融合、安全可控性四个维度
正义的算法迷宫—人工智能重构司法体系的技术悖论与文明试炼
一、法庭的数字化迁徙当美国威斯康星州法院采纳COMPAS算法评估被告再犯风险，当中国"智慧法院"系统年处理1.2亿件案件，司法体系正经历从石柱法典到代码裁判的范式革命。这场转型的核心驱动力是司法效率与公正的永恒张力：美国重罪案件平均审理周期达18个月，中国基层法官年人均结案357件（是德国同行的6倍），而算法能在0.3秒内完成百万份文书比对。人工智能渗透司法引发三重裂变：证据分析从经验推断转向数据
【python实战】不玩微博，一封邮件就能知道实时热榜，天秀吃瓜一条coding 从实战学python 人工智能 python linux 爬虫
❤️欢迎订阅《从实战学python》专栏，用python实现办公自动化、数据可视化、人工智能等各个方向的实战案例，有趣又有用！❤️更多精品专栏简介点这里有的人金玉其表败絮其中，有的人却若彩虹般绚烂，怦然心动前言哈喽，大家好，我是一条。在生活中我是一个不太喜欢逛娱乐平台的人，抖音、快手、微博我手机里都没装，甚至微信朋友圈都不看，但是自从开始写博客，有些热度不得不蹭。所以就有了这样一个需求，能不能让微
MCP协议：AI时代的“万能插座”如何重构IT生态与未来
MCP协议：AI时代的“万能插座”如何重构IT生态与未来在人工智能技术爆炸式发展的浪潮中，一个名为ModelContextProtocol（MCP）的技术协议正以惊人的速度重塑IT行业的底层逻辑。2024年11月由Anthropic首次发布，MCP在短短半年内获得OpenAI、谷歌、亚马逊、阿里、腾讯等全球科技巨头的支持，被业内誉为AI时代的HTTP协议或USB-C接口，正在成为连接大模型与现实世
《算法备案全攻略：规范与流程引领数字时代新秩序》算法及大模型备案顾问刘老师算法备案深度学习 AIGC 语言模型算法人工智能
一、算法备案：开启合规新征程（一）备案规定的起源与发展2022年国家互联网信息办公室、工业和信息化部、公安部、国家市场监督管理总局联合发布《互联网信息服务算法推荐管理规定》，自2022年3月1日起施行。此后，相关规定不断完善和演进。如国家网信办于2022年8月、10月及2023年1月先后三次公布了《境内互联网信息服务算法备案清单》。同时，2022年发布的最高人民法院《关于规范和加强人工智能司法应用
C语言学生成绩管理系统<；自创>；(功能7有小错误,但可运行） han_xue_feng java
腾讯云加速企业和个人开发创新公开直播预告直播预告：07/18(周四)15:00-16:00随着人工智能与大模型的蓬勃发展，我们正步入一个由技微信实习第一天周五入职，早上早早来到了公司，发现好多人都没上班，到十点才陆陆续续有人来，办理完入职后，mentor中联夏令营遗憾没有入选不过hr的回复真的很好，辛苦啦#提前批简历挂麻了怎么办##机械制造投递记录#大数据开发的工作有点过于简单了吧sq大数据开发的
Python 实战人工智能数学基础：推荐系统应用 AI天才研究院 AI大模型企业级应用开发实战大数据人工智能语言模型 Java Python 架构设计
作者：禅与计算机程序设计艺术文章目录1.背景介绍2.核心概念与联系2.1用户画像2.2相似性计算2.2.1基于物品的相似度2.2.2基于用户的相似度2.3协同过滤算法2.3.1基于用户的协同过滤算法2.3.2基于物品的协同过滤算法2.3.3基于上下文的协同过滤算法3.核心算法原理和具体操作步骤以及数学模型公式详细讲解3.1基于用户的协同过滤算法3.2基于物品的协同过滤算法3.3混合协同过滤算法3.
Python桌面应用开发的未来——智能化工具与大模型赋能 IronwoodStag78
开发AI智能应用，就下载InsCodeAIIDE，一键接入DeepSeek-R1满血版大模型！标题：Python桌面应用开发的未来——智能化工具与大模型赋能随着人工智能技术的飞速发展，传统软件开发模式正在被重新定义。Python作为一门功能强大且灵活的语言，在桌面应用开发领域一直占据重要地位。然而，面对日益复杂的用户需求和快速变化的技术环境，如何提升开发效率、降低开发门槛，成为开发者亟需解决的问题
OpenCV图片操作100例：从入门到精通指南（1）总有刁民想爱朕ha opencv 计算机视觉人工智能
OpenCV图片操作100例：从入门到精通指南本文整理了100个OpenCV实用技巧，涵盖图像处理各个领域，助你轻松掌握计算机视觉核心技能！一、入门必备：基础操作1.图像读写与显示importcv2#读取图像（BGR格式）img=cv2.imread('image.jpg')#显示图像cv2.imshow('示例图片',img)cv2.waitKey(0)#按任意键退出cv2.destroyAll
OpenCV图片操作100例：从入门到精通指南（3）总有刁民想爱朕ha opencv 人工智能计算机视觉
高效学习路径：1️⃣分阶段学习：入门：1-20例（基础操作）进阶：21-50例（图像处理）高级：51-100例（计算机视觉）2️⃣项目驱动学习：证件照背景替换（1-15例）停车场车位检测（30-45例）视频运动追踪（70-85例）3️⃣性能优化技巧：#使用UMat加速图像处理umat_img=cv2.UMat(img)processed=cv2.GaussianBlur(umat_img,(5,5
OpenCV入门到精通：AI视觉处理的完整指南 AI云原生与云计算技术学院人工智能 opencv 计算机视觉 ai
OpenCV入门到精通：AI视觉处理的完整指南关键词：OpenCV、计算机视觉、图像预处理、目标检测、AI视觉应用摘要：本文是一份面向AI视觉爱好者的OpenCV完整学习指南。从OpenCV的核心概念讲起，结合生活案例、代码示例和项目实战，逐步拆解图像读取/显示、灰度化、边缘检测、目标检测等关键技术。无论你是想入门计算机视觉的新手，还是希望用OpenCV解决实际问题的开发者，都能通过本文掌握从理论
CNN 猫狗识别：从理论到实战的深度解析爱熬夜的小古 cnn 深度学习人工智能
在计算机视觉领域，卷积神经网络（ConvolutionalNeuralNetwork，CNN）凭借其强大的特征提取和模式识别能力，成为图像分类任务的主流技术。猫狗识别作为经典的图像分类问题，不仅能帮助我们理解CNN的工作原理，还能为实际应用提供技术支持。本文将深入探讨CNN在猫狗识别中的应用，从理论基础到实战代码，带你全面掌握这项技术。一、CNN基础理论概述（一）CNN的核心组件卷积层：是CNN的
OpenCV入门到精通：从基础到实战的全面指南
摘要：本文旨在为初学者和有一定经验的开发者提供OpenCV从入门到精通的全面指南。文章首先介绍了OpenCV的基本概念和安装方法，然后深入讲解了图像处理基础、特征检测与匹配、视频处理与分析等核心内容，最后通过实战案例展示了OpenCV在计算机视觉任务中的应用。关键词：OpenCV；图像处理；特征检测；视频分析；实战案例引言OpenCV（OpenSourceComputerVisionLibrary
深度学习实战-使用TensorFlow与Keras构建智能模型程序员Gloria Python超入门 TensorFlow python
深度学习实战-使用TensorFlow与Keras构建智能模型深度学习已经成为现代人工智能的重要组成部分，而Python则是实现深度学习的主要编程语言之一。本文将探讨如何使用TensorFlow和Keras构建深度学习模型，包括必要的代码实例和详细的解析。1.深度学习简介深度学习是机器学习的一个分支，使用多层神经网络来学习和表示数据中的复杂模式。其广泛应用于图像识别、自然语言处理、推荐系统等领域。
AI产品经理需要了解的算法知识 AI劳模人工智能产品经理 AI产品经理 AI产品经理入门零基础入门产品经理算法语言模型
1、自然语言生成（NLG）自然语言生成（NaturalLanguageGeneration，简称NLG）是一种人工智能技术，它的目标是将计算机的数据、逻辑或算法产生的信息转换成人类可读的自然语言文本。换句话说，NLG能让机器“学会”写文章、报告、故事或者其他任何形式的文字，就像人类作家那样。这项技术使得机器能够理解复杂的数据并将其转化为易于理解的语言，以适应不同的受众和情境。应用实例：金融报告自动
【Python】OpenAI API 宅男很神经 python 开发语言
【Python与OpenAIAPI深度探索：从基础到未来】第一章：OpenAIAPI概览与核心概念1.1OpenAIAPI是什么？能做什么？OpenAIAPI(ApplicationProgrammingInterface，应用程序编程接口)是一套允许开发者通过编程方式访问和使用OpenAI开发的各种先进人工智能模型的服务。这些模型经过海量数据的训练，能够在多种任务上达到甚至超越人类水平。通过AP
Python：操作 Word 对齐方式 Thomas Kant Python python word c#
亲爱的技术爱好者们，热烈欢迎来到Kant2048的博客！我是ThomasKant，很开心能在CSDN上与你们相遇～本博客的精华专栏：【自动化测试】【测试经验】【人工智能】【Python】Python：操作Word对齐方式详解（左对齐/右对齐/居中/两端对齐）在日常办公自动化中，我们经常需要对Word文档中的段落设置对齐方式，如左对齐、右对齐、居中、两端对齐等。本文将带你使用python-docx库
TestCafe ➜ Playwright fixture 架构迁移指南 Thomas Kant 自动化测试 playwright testcafe typescript 测试架构
亲爱的技术爱好者们，热烈欢迎来到Kant2048的博客！我是ThomasKant，很开心能在CSDN上与你们相遇～本博客的精华专栏：【自动化测试】【测试经验】【人工智能】【Python】
医疗金融预测与语音识别中的模型优化及可解释性技术突破智能计算研究中心其他
内容概要随着人工智能技术的纵深发展，模型优化与可解释性技术正在重塑医疗诊断、金融预测及语音识别领域的应用范式。在医疗领域，基于自适应学习的动态参数调整机制，结合迁移学习的跨场景知识复用，显著提升了疾病筛查模型的泛化能力；而金融预测场景中，联邦学习框架通过分布式数据协作，在保障隐私安全的前提下，实现了风险预测模型的多维度优化。语音识别领域则依托边缘计算架构，将模型压缩技术与实时推理引擎结合，有效解决
Linux的Initrd机制被触发 linux
Linux 的 initrd 技术是一个非常普遍使用的机制，linux2.6 内核的 initrd 的文件格式由原来的文件系统镜像文件转变成了 cpio 格式，变化不仅反映在文件格式上， linux 内核对这两种格式的 initrd 的处理有着截然的不同。本文首先介绍了什么是 initrd 技术，然后分别介绍了 Linux2.4 内核和 2.6 内核的 initrd 的处理流程。最后通过对 Lin
maven本地仓库路径修改 bitcarter maven
默认maven本地仓库路径：C:\Users\Administrator\.m2 修改maven本地仓库路径方法： 1.打开E:\maven\apache-maven-2.2.1\conf\settings.xml 2.找到
XSD和XML中的命名空间 darrenzhu xml xsd schema namespace 命名空间
http://www.360doc.com/content/12/0418/10/9437165_204585479.shtml http://blog.csdn.net/wanghuan203/article/details/9203621 http://blog.csdn.net/wanghuan203/article/details/9204337 http://www.cn
Java 求素数运算周凡杨 java 算法素数
网络上对求素数之解数不胜数，我在此总结归纳一下，同时对一些编码，加以改进，效率有成倍热提高。第一种：原理: 6N(+-)1法任何一个自然数，总可以表示成为如下的形式之一： 6N，6N+1，6N+2，6N+3，6N+4，6N+5 (N=0，1，2，…)
java 单例模式 g21121 java
想必单例模式大家都不会陌生，有如下两种方式来实现单例模式： class Singleton { private static Singleton instance=new Singleton(); private Singleton(){} static Singleton getInstance() { return instance; }
Linux下Mysql源码安装 510888780 mysql
1.假设已经有mysql-5.6.23-linux-glibc2.5-x86_64.tar.gz (1)创建mysql的安装目录及数据库存放目录解压缩下载的源码包，目录结构，特殊指定的目录除外：
32位和64位操作系统墙头上一根草 32位和64位操作系统
32位和64位操作系统是指：CPU一次处理数据的能力是32位还是64位。现在市场上的CPU一般都是64位的，但是这些CPU并不是真正意义上的64 位CPU，里面依然保留了大部分32位的技术，只是进行了部分64位的改进。32位和64位的区别还涉及了内存的寻址方面，32位系统的最大寻址空间是2 的32次方= 4294967296（bit）= 4（GB）左右，而64位系统的最大寻址空间的寻址空间则达到了
我的spring学习笔记10-轻量级_Spring框架 aijuans Spring 3
一、问题提问： → 请简单介绍一下什么是轻量级？轻量级（Leightweight）是相对于一些重量级的容器来说的，比如Spring的核心是一个轻量级的容器，Spring的核心包在文件容量上只有不到1M大小，使用Spring核心包所需要的资源也是很少的，您甚至可以在小型设备中使用Spring。
mongodb 环境搭建及简单CURD antlove Web Install curd NoSQL mongo
一搭建mongodb环境 1. 在mongo官网下载mongodb 2. 在本地创建目录 "D:\Program Files\mongodb-win32-i386-2.6.4\data\db" 3. 运行mongodb服务 [mongod.exe --dbpath "D:\Program Files\mongodb-win32-i386-2.6.4\data\
数据字典和动态视图百合不是茶 oracle 数据字典动态视图系统和对象权限
数据字典（data dictionary）是 Oracle 数据库的一个重要组成部分，这是一组用于记录数据库信息的只读（read-only）表。随着数据库的启动而启动,数据库关闭时数据字典也关闭数据字典中包含数据库中所有方案对象（schema object）的定义(包括表，视图，索引，簇，同义词，序列，过程，函数，包，触发器等等) 数据库为一
多线程编程一般规则 bijian1013 java thread 多线程 java多线程
如果两个工两个以上的线程都修改一个对象，那么把执行修改的方法定义为被同步的，如果对象更新影响到只读方法，那么只读方法也要定义成同步的。不要滥用同步。如果在一个对象内的不同的方法访问的不是同一个数据，就不要将方法设置为synchronized的。
将文件或目录拷贝到另一个Linux系统的命令scp bijian1013 linux unix scp
一.功能说明 scp就是security copy，用于将文件或者目录从一个Linux系统拷贝到另一个Linux系统下。scp传输数据用的是SSH协议，保证了数据传输的安全，其格式如下： scp 远程用户名@IP地址：文件的绝对路径
【持久化框架MyBatis3五】MyBatis3一对多关联查询 bit1129 Mybatis3
以教员和课程为例介绍一对多关联关系，在这里认为一个教员可以叫多门课程，而一门课程只有1个教员教，这种关系在实际中不太常见，通过教员和课程是多对多的关系。示例数据：地址表： CREATE TABLE ADDRESSES ( ADDR_ID INT(11) NOT NULL AUTO_INCREMENT, STREET VAR
cookie状态判断引发的查找问题 bitcarter form cgi
先说一下我们的业务背景： 1.前台将图片和文本通过form表单提交到后台，图片我们都做了base64的编码，并且前台图片进行了压缩 2.form中action是一个cgi服务 3.后台cgi服务同时供PC，H5，APP 4.后台cgi中调用公共的cookie状态判断方法（公共的，大家都用，几年了没有问题）问题：（折腾两天。。。。） 1.PC端cgi服务正常调用，cookie判断没
通过Nginx,Tomcat访问日志(access log)记录请求耗时 ronin47
一、Nginx通过$upstream_response_time $request_time统计请求和后台服务响应时间 nginx.conf使用配置方式： log_format main '$remote_addr - $remote_user [$time_local] "$request" ''$status $body_bytes_sent "$http_r
java-67- n个骰子的点数。把n个骰子扔在地上，所有骰子朝上一面的点数之和为S。输入n，打印出S的所有可能的值出现的概率。 bylijinnan java
public class ProbabilityOfDice { /** * Q67 n个骰子的点数 * 把n个骰子扔在地上，所有骰子朝上一面的点数之和为S。输入n，打印出S的所有可能的值出现的概率。 * 在以下求解过程中，我们把骰子看作是有序的。 * 例如当n=2时，我们认为（1，2）和（2，1）是两种不同的情况 */ private stati
看别人的博客，觉得心情很好 Cb123456 博客心情
以为写博客，就是总结，就和日记一样吧，同时也在督促自己。今天看了好长时间博客: 职业规划: http://www.iteye.com/blogs/subjects/zhiyeguihua android学习: 1.http://byandby.i
[JWFD开源工作流]尝试用原生代码引擎实现循环反馈拓扑分析 comsci 工作流
我们已经不满足于仅仅跳跃一次，通过对引擎的升级，今天我测试了一下循环反馈模式，大概跑了200圈，引擎报一个溢出错误在一个流程图的结束节点中嵌入一段方程，每次引擎运行到这个节点的时候，通过实时编译器GM模块，计算这个方程，计算结果与预设值进行比较，符合条件则跳跃到开始节点，继续新一轮拓扑分析，直到遇到
JS常用的事件及方法 cwqcwqmax9 js
事件描述 onactivate 当对象设置为活动元素时触发。 onafterupdate 当成功更新数据源对象中的关联对象后在数据绑定对象上触发。 onbeforeactivate 对象要被设置为当前元素前立即触发。 onbeforecut 当选中区从文档中删除之前在源对象触发。 onbeforedeactivate 在 activeElement 从当前对象变为父文档其它对象之前立即
正则表达式验证日期格式 dashuaifu 正则表达式 IT其它 java其它
正则表达式验证日期格式 function isDate(d){ var v = d.match(/^(\d{4})-(\d{1,2})-(\d{1,2})$/i); if(!v) { this.focus(); return false; } } <input value="2000-8-8" onblu
Yii CModel.rules() 方法、validate预定义完整列表、以及说说验证 dcj3sjt126com yii
public array rules () {return} array 要调用 validate() 时应用的有效性规则。返回属性的有效性规则。声明验证规则，应重写此方法。每个规则是数组具有以下结构：array('attribute list', 'validator name', 'on'=>'scenario name', ...validation
UITextAttributeTextColor = deprecated in iOS 7.0 dcj3sjt126com ios
In this lesson we used the key "UITextAttributeTextColor" to change the color of the UINavigationBar appearance to white. This prompts a warning "first deprecated in iOS 7.0." Ins
判断一个数是质数的几种方法 EmmaZhao Math python
质数也叫素数，是只能被1和它本身整除的正整数，最小的质数是2，目前发现的最大的质数是p=2^57885161-1【注1】。判断一个数是质数的最简单的方法如下： def isPrime1(n): for i in range(2, n): if n % i == 0: return False return True 但是在上面的方法中有一些冗余的计算，所以
SpringSecurity工作原理小解读坏我一锅粥 SpringSecurity
SecurityContextPersistenceFilter ConcurrentSessionFilter WebAsyncManagerIntegrationFilter HeaderWriterFilter CsrfFilter LogoutFilter Use
JS实现自适应宽度的Tag切换 ini JavaScript html Web css html5
效果体验：http://hovertree.com/texiao/js/3.htm 该效果使用纯JavaScript代码，实现TAB页切换效果，TAB标签根据内容自适应宽度，点击TAB标签切换内容页。 HTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"
Hbase Rest API : 数据查询 kane_xie REST hbase
hbase（hadoop）是用java编写的，有些语言（例如python）能够对它提供良好的支持，但也有很多语言使用起来并不是那么方便，比如c#只能通过thrift访问。Rest就能很好的解决这个问题。Hbase的org.apache.hadoop.hbase.rest包提供了rest接口，它内嵌了jetty作为servlet容器。启动命令：./bin/hbase rest s
JQuery实现鼠标拖动元素移动位置（源码+注释）明子健 jquery js 源码拖动鼠标
欢迎讨论指正！ print.html代码： <!DOCTYPE html> <html> <head> <meta http-equiv=Content-Type content="text/html;charset=utf-8"> <title>发票打印</title> &l
Postgresql 连表更新字段语法 update qifeifei PostgreSQL
下面这段sql本来目的是想更新条件下的数据，可是这段sql却更新了整个表的数据。sql如下： UPDATE tops_visa.visa_order SET op_audit_abort_pass_date = now() FROM tops_visa.visa_order as t1 INNER JOIN tops_visa.visa_visitor as t2 ON t1.
将redis,memcache结合使用的方案? tcrct redis cache
公司架构上使用了阿里云的服务，由于阿里的kvstore收费相当高，打算自建，自建后就需要自己维护，所以就有了一个想法，针对kvstore(redis)及ocs(memcache)的特点，想自己开发一个cache层，将需要用到list，set，map等redis方法的继续使用redis来完成，将整条记录放在memcache下，即findbyid，save等时就memcache，其它就对应使用redi
开发中遇到的诡异的bug wudixiaotie bug
今天我们服务器组遇到个问题：我们的服务是从Kafka里面取出数据，然后把offset存储到ssdb中，每个topic和partition都对应ssdb中不同的key，服务启动之后，每次kafka数据更新我们这边收到消息，然后存储之后就发现ssdb的值偶尔是-2,这就奇怪了，最开始我们是在代码中打印存储的日志，发现没什么问题，后来去查看ssdb的日志，才发现里面每次set的时候都会对同一个key

稳定扩散ControlNet v1.1 权威指南

1、什么是ControlNet?

1.1 ControlNet边缘检测示例

1.2 ControlNet人体姿势检测示例

2、安装稳定扩散ControlNet

2.1 在Colab中安装ControlNet

2.2 安装 ControlNet 扩展 （Windows/Mac）

3、安装 T2I 适配器

4、更新 ControlNet 扩展

4.1 选项 1：从 Web UI 更新

4.2 选项 2：命令行

5、使用 ControlNet的简单例子

5.1 文本到图像设置

5.2 ControlNet设置

6、预处理器和模型

6.1 选择正确的模型

6.2 OpenPose预处理器

6.3 切片重采样

6.4 引用预处理器

6.5 Canny边缘检测器

6.6 深度预处理器

6.7 线条艺术

6.8 MLSD

6.9 法线贴图

6.10 涂鸦

6.11 分割预处理器

6.12 随机播放

6.13 颜色栅格T2I 适配器

6.14 Clip vision style T2I 适配器

6.15 ControlNet InPainting

7、ControlNet设置完整说明

7.1 输入控制

7.2 模型选择

7.3 控制权重

7.4 控制模式

7.5 调整大小模式

8、 多个ControlNet

9、模仿人体姿势

9.1 示例 1：从图像复制姿势

9.2 示例 2：重新混合影片场景

10、使用 ControlNet 对图像进行风格化处理

11、使用魔术姿势控制姿势

12、室内设计思路

13、稳定扩散深度模型与ControlNet的区别

14、ControlNet如何工作？

你可能感兴趣的:(计算机视觉,人工智能)

2.2 安装 ControlNet 扩展（Windows/Mac）

8、多个ControlNet