阿Q说代码

【AI作画】使用Stable Diffusion的艺术二维码完全生成攻略

文章目录

前言
- Stable Diffusion 简介
什么是云端平台？
- 优势
- - 灵活性和可扩展性
  - 成本效益
  - 高可用性和容错性
  - 管理简便性
- 选择适合的云端平台
平台优势
平台操作
- 购买算力并创建工作空间
- 启动工作空间
- 应用市场一键安装
使用Stable-Diffusion作图
- 使用控制网络将文本转图像
- 二维码生成
- 安装插件——After Detailer
- 安装QR Code Monster 模型
- 模型参数设置
- 出图

前言

随着人工智能技术的快速发展，特别是深度学习和生成模型的突破，AI作图已经成为许多领域的主要工具和方法之一。它不仅提高了创造力和效率，还改变了我们与图像、数据和媒体的交互方式。今天请跟随阿Q的脚步，一起来使用 Stable Diffusion 创作出属于我们自己的作品。

Stable Diffusion 简介

Stable Diffusion 是一款流行的人工智能图像生成器，可以在我们的 PC 上运行。但是运行 Stable Diffusion 需要不错的计算机硬件的支持，给你来点直观的数据感受下，以下是最低的配置需求：

CPU： AMD 或 Intel CPU。
RAM：至少 16 GB DDR4 或 DDR5 RAM。
存储：256 GB 或更大的SATA 或 NVMe 固态驱动器。您需要至少 10 GB 的可用空间。通常，1 TB 驱动器提供每 GB 存储的最佳价格。
GPU：具有至少 8 GB GDDR6 内存的 GeForce RTX GPU。

什么是云端平台？

看到这儿，你可能会说：难道要 AI 作画，我必须要组装一台高性能的 PC 吗？答案是否定的，因为组装一台高性能 PC 的成本比较大，所以我们完全可以借助云端平台来完成。

云端平台是指通过互联网提供的计算资源和服务，可以帮助用户在云环境中进行应用开发、数据存储和处理、运行应用程序等各种任务。它提供了虚拟化的计算资源，包括计算能力、存储空间、网络连接等，用户可以按需使用这些资源，避免了传统计算机资源的购买、部署和维护成本。

优势

灵活性和可扩展性

用户可以根据需要快速调整计算资源的规模和配置，以适应不同的工作负载变化。云端平台提供了弹性的资源分配和强大的扩展能力，可以根据实际需求进行资源调整。

成本效益

云端平台采用按需付费的模式，用户只需支付实际使用的计算资源，避免了购买昂贵的硬件设备和维护成本。同时，由于云端平台的规模经济效应，它可以提供更具竞争力的价格。

高可用性和容错性

云端平台通常具有多个数据中心和冗余的设备，能够提供高可用性和容错性，保证用户的应用和数据始终可靠地运行。

管理简便性

云端平台提供了统一的管理界面和工具，使用户可以方便地管理和监控计算资源、应用程序和数据。同时，云端平台也负责底层基础设施的更新、维护和安全性，减轻了用户的管理负担。

选择适合的云端平台

选择适合的云端平台需要从我们自身的需求出发，看看哪种云端平台最符合我们的要求，成本又最低。通常我们会从以下几个方面来考虑：

业务需求：首先要明确自己的业务需求，包括计算资源、存储容量、网络带宽、安全性要求等。不同的云服务商可能在这些方面提供不同的选择和配置。
价格和费用结构：比较不同云服务商的定价模型和费用结构，包括计算资源、存储、数据传输等费用。了解不同服务商的计费方式，找到与自己业务需求相匹配的经济实惠的选项。
功能和服务：比较不同云服务商提供的功能和服务，包括计算实例类型、数据库、网络和安全服务等。根据自身需求选择能够提供适合功能和服务的云端平台。
可用性和可靠性：了解云服务商的系统稳定性、容错性和备份策略，确保业务数据的安全和可靠性。重点关注其数据中心的地理分布和冗余配置。
数据安全和隐私保护：了解云服务商的数据安全措施和隐私政策，确保其能够提供符合自身业务需求的数据安全保护措施，包括物理安全、网络安全、身份认证和数据加密等。

今天我们就使用成本最低的揽睿星舟-GPU算力平台来帮助我们来完成AI 作画。

平台优势

揽睿星舟是一家知名的云端平台提供商，提供企业级的云计算服务和解决方案。他的优势相当明显：

巨大的计算能力：揽睿星舟平台拥有强大的计算资源和处理能力，可以满足各种规模和需求的企业应用。无论是小型企业还是大型企业，都可以依托揽睿星舟平台实现高效的计算任务。
安全稳定的基础设施：揽睿星舟平台采用高度安全和可靠的基础设施架构，包括多个数据中心、冗余设备和严格的安全措施。用户的数据和应用程序在揽睿星舟平台上得到充分的保护，不会轻易丢失或泄漏。
灵活可扩展的资源配置：揽睿星舟平台为用户提供了灵活的资源配置和按需扩展的能力。用户可以根据实际需求调整计算资源的规模和配置，实现资源的弹性伸缩，避免因资源不足或闲置而造成的浪费。
全面的解决方案和服务：揽睿星舟平台提供了全面的云计算解决方案和丰富的服务，包括虚拟化基础设施、平台即服务、存储和数据库服务、网络和安全服务等。用户可以根据自身需求选择适合的服务组合，快速构建和部署应用程序。
简化的管理和运维：揽睿星舟平台提供了直观易用的管理界面和工具，使用户可以方便地管理和监控计算资源、应用程序和数据。同时，揽睿星舟平台也负责底层基础设施的维护和更新，减轻了用户的管理负担。
优秀的生态系统和合作伙伴：揽睿星舟平台与众多知名企业和开发者建立了合作关系，形成了庞大的生态系统。用户可以从这个生态系统中获取各种应用、工具和服务，加速应用开发和部署的效率。

值得注意的是，这个平台提供了10G的免费网盘空间供你使用，但如果需要额外挂载数据盘，可能会有一定的收费。所以在使用完毕后，请务必及时关停服务器，避免造成不必要的费用。同时，为了保证账单的准确性，最好核对一下账单，如果有任何疑问，可以随时向客服咨询。

平台操作

首先我们需要在这注册一下帐号，完成登录操作。

购买算力并创建工作空间

新用户在这个GPU算力平台上将获得两个小时的免费使用时间，可以选择强大的3090型号的显卡进行训练。这款显卡性能卓越，能够极大地加速模型的训练过程，让你在有限时间内获得更好的结果。

可以从平台提供的丰富镜像库中选择公有镜像-others-sd-trainer-1.1.0

启动工作空间

点击启动训练任务，稍等几分钟，就能轻松地进入训练环境。这个过程非常简单，只需要几个简单的步骤，你就可以开始你的AI之旅：

如果在启动过程中遇到网络问题，不要着急，你可以先尝试调试网络连接，然后选择重新启动。不用担心，这个过程不会对你的费用造成任何损失。平台会为你提供免费的重新启动机会，确保你能够顺利开始你的训练任务。
在进入训练环境后，你可以根据个人习惯和喜好选择适合自己的集成开发环境（IDE）。在这里，我选择使用VS Code，因为它是一款强大而灵活的IDE，拥有丰富的插件和扩展功能，可以满足各种编程需求。

应用市场一键安装

除了上述方法，也可以选择在应用市场一键安装，这样大大省去了自行搭建的步骤：

在我的应用里点击Stable-Diffusion
选择新建实例
选择web3.0，这里默认使用3090，为1.9/h，点击创建实例。
点击地址，即可进行体验。

使用Stable-Diffusion作图

使用控制网络将文本转图像

文本转图像：我们可以创造出带有提示的图像，就像给计算机一些关键信息让它完成绘画一样。而且我们还能够通过在图像制作过程中使用带有QR码输入的ControlNet，就像是给计算机一些特殊指令，来对图像生成过程进行精细调整和干预，确保最终的图像符合我们的预期。这就像是在制作一幅画时，不仅告诉计算机要画什么，还能在每一步告诉它怎么画，从而得到更理想的结果。相比于图像到图像，文本转图像会有更好的效果。

Stable Diffusion中的文生图介绍：

Stable Diffusion中的文生图采样脚本，称为"txt2img"，接受一个提示词，以及包括采样器（sampling type），图像尺寸，和随机种子的各种选项参数，并根据模型对提示的解释生成一个图像文件。生成的图像带有不可见的数字水印标签，以允许用户识别由Stable Diffusion生成的图像，尽管如果图像被调整大小或旋转，该水印将失去其有效性。 Stable Diffusion模型是在由512×512分辨率图像组成的数据集上训练出来的，这意味着txt2img生成图像的最佳配置也是以512×512的分辨率生成的，偏离这个大小会导致生成输出质量差。Stable Diffusion 2.0版本后来引入了以768×768分辨率图像生成的能力。每一个txt2img的生成过程都会涉及到一个影响到生成图像的随机种子；用户可以选择随机化种子以探索不同生成结果，或者使用相同的种子来获得与之前生成的图像相同的结果。用户还可以调整采样迭代步数（inference steps）；较高的值需要较长的运行时间，但较小的值可能会导致视觉缺陷。另一个可配置的选项，即无分类指导比例值，允许用户调整提示词的相关性（classifier-free guidance scale value）；更具实验性或创造性的用例可以选择较低的值，而旨在获得更具体输出的用例可以使用较高的值。反向提示词（negative prompt）是包含在Stable Diffusion的一些用户界面软件中的一个功能（包括StabilityAI自己的“Dreamstudio”云端软件即服务模式订阅制服务），它允许用户指定模型在图像生成过程中应该避免的提示，适用于由于用户提供的普通提示词，或者由于模型最初的训练，造成图像输出中出现不良的图像特征，例如畸形手脚。与使用强调符（emphasis marker）相比，使用反向提示词在降低生成不良的图像的频率方面具有高度统计显著的效果；强调符是另一种为提示的部分增加权重的方法，被一些Stable Diffusion的开源实现所利用，在关键词中加入括号以增加或减少强调。

参数：

Control weight: 权重越高，ControlNet对输出的影响越大。
Start control step: ControlNet开始生效时生成进程的百分比。
End control step: ControlNet停止生效时生成进程的百分比。

二维码生成

推荐使用QR Toolkit来生成二维码，网站界面如下:

参数介绍：整体的一个构造思想——将二维码和你要绘制的图片融合在一起，使得整体看起来不违和，可以多次尝试。

文本框：填写你想制作成二维码的链接或者是文字。
Error Correction： 容错率，数值越高，抗损毁能力越强，在二维码部分被损害的情况下也可以识别，这里建议选择最高。
Boost ECC： 加强容错率，直接选。
Mask Patten： 二维码样式，可以去尝试选择一个分布均匀的，这样与图片融合会更加自然。
Markers： 二维码内部的一些样式，可以多去尝试，在能识别的情况下，尽可能让二维码变得均匀。
Margin： 空白，在二维码边缘添加噪声，让二维码形式弱化。
Transform：旋转，以x、y等方向旋转二维码。

安装插件——After Detailer

插件地址：https://github.com/Bing-su/adetailer
安装方式：

打开webui
打开扩展栏-Extensions
打开 Install from URL栏
输入git地址并点击install，重新启动UI即可看到。
参数设置如下图所示：点击启用，选择模型，调整参数，其他不变

安装QR Code Monster 模型

步骤：

打开https://huggingface.co/monster-labs/control_v1p_sd15_qrcode_monster，我们需要下载的是一个模型文件和一个配置文件
下载后将模型和配置文件放到Controlnet->models文件夹内。（模型文件和配置文件缺一不可！）
安装好后重启UI可以在ControlNet界面选择模型。

在ControlNet界面，启用该插件，预处理Preprocessor设置为None，即不进行预处理，模型设置为刚下载的模型，开始控制设置为0-0.1，终止控制设置为0.8-1，可以之后自行调参，控制模式设置为平衡，Resize Mode设置为 Resize and Fill。

模型参数设置

模型选择：我这里选择国风3，
步数：50
采样器：DPM++ 2M SDE Karras
CFG：7
尺寸：512*512 px
Hire.fix：是否开启高清修复，选择。

Prompts:

masterpiece, top quality, best quality, 1 girl, full body, flowers

Negative Prompts:

(nsfw)), (worst quality, low quality:2) , ng_deepnegative_v1_75t, EasyNegative, badhandv4