随着人工智能技术的快速发展,特别是深度学习和生成模型的突破,AI作图已经成为许多领域的主要工具和方法之一。它不仅提高了创造力和效率,还改变了我们与图像、数据和媒体的交互方式。今天请跟随阿Q的脚步,一起来使用 Stable Diffusion 创作出属于我们自己的作品。
Stable Diffusion 是一款流行的人工智能图像生成器,可以在我们的 PC 上运行。但是运行 Stable Diffusion 需要不错的计算机硬件的支持,给你来点直观的数据感受下,以下是最低的配置需求:
看到这儿,你可能会说:难道要 AI 作画,我必须要组装一台高性能的 PC 吗?答案是否定的,因为组装一台高性能 PC 的成本比较大,所以我们完全可以借助云端平台来完成。
云端平台是指通过互联网提供的计算资源和服务,可以帮助用户在云环境中进行应用开发、数据存储和处理、运行应用程序等各种任务。它提供了虚拟化的计算资源,包括计算能力、存储空间、网络连接等,用户可以按需使用这些资源,避免了传统计算机资源的购买、部署和维护成本。
用户可以根据需要快速调整计算资源的规模和配置,以适应不同的工作负载变化。云端平台提供了弹性的资源分配和强大的扩展能力,可以根据实际需求进行资源调整。
云端平台采用按需付费的模式,用户只需支付实际使用的计算资源,避免了购买昂贵的硬件设备和维护成本。同时,由于云端平台的规模经济效应,它可以提供更具竞争力的价格。
云端平台通常具有多个数据中心和冗余的设备,能够提供高可用性和容错性,保证用户的应用和数据始终可靠地运行。
云端平台提供了统一的管理界面和工具,使用户可以方便地管理和监控计算资源、应用程序和数据。同时,云端平台也负责底层基础设施的更新、维护和安全性,减轻了用户的管理负担。
选择适合的云端平台需要从我们自身的需求出发,看看哪种云端平台最符合我们的要求,成本又最低。通常我们会从以下几个方面来考虑:
今天我们就使用成本最低的 揽睿星舟-GPU算力平台 来帮助我们来完成AI 作画。
揽睿星舟是一家知名的云端平台提供商,提供企业级的云计算服务和解决方案。他的优势相当明显:
值得注意的是,这个平台提供了10G的免费网盘空间供你使用,但如果需要额外挂载数据盘,可能会有一定的收费。所以在使用完毕后,请务必及时关停服务器,避免造成不必要的费用。同时,为了保证账单的准确性,最好核对一下账单,如果有任何疑问,可以随时向客服咨询。
首先我们需要在这注册一下帐号,完成登录操作。
新用户在这个GPU算力平台上将获得两个小时的免费使用时间,可以选择强大的3090型号的显卡进行训练。这款显卡性能卓越,能够极大地加速模型的训练过程,让你在有限时间内获得更好的结果。
可以从平台提供的丰富镜像库中选择公有镜像-others-sd-trainer-1.1.0
点击启动训练任务,稍等几分钟,就能轻松地进入训练环境。这个过程非常简单,只需要几个简单的步骤,你就可以开始你的AI之旅:
除了上述方法,也可以选择在应用市场一键安装,这样大大省去了自行搭建的步骤:
文本转图像: 我们可以创造出带有提示的图像,就像给计算机一些关键信息让它完成绘画一样。而且我们还能够通过在图像制作过程中使用带有QR码输入的ControlNet,就像是给计算机一些特殊指令,来对图像生成过程进行精细调整和干预,确保最终的图像符合我们的预期。这就像是在制作一幅画时,不仅告诉计算机要画什么,还能在每一步告诉它怎么画,从而得到更理想的结果。相比于图像到图像,文本转图像会有更好的效果。
Stable Diffusion中的文生图介绍:
Stable Diffusion中的文生图采样脚本,称为"txt2img",接受一个提示词,以及包括采样器(sampling type),图像尺寸,和随机种子的各种选项参数,并根据模型对提示的解释生成一个图像文件。生成的图像带有不可见的数字水印标签,以允许用户识别由Stable Diffusion生成的图像,尽管如果图像被调整大小或旋转,该水印将失去其有效性。 Stable Diffusion模型是在由512×512分辨率图像组成的数据集上训练出来的,这意味着txt2img生成图像的最佳配置也是以512×512的分辨率生成的,偏离这个大小会导致生成输出质量差。Stable Diffusion 2.0版本后来引入了以768×768分辨率图像生成的能力。每一个txt2img的生成过程都会涉及到一个影响到生成图像的随机种子;用户可以选择随机化种子以探索不同生成结果,或者使用相同的种子来获得与之前生成的图像相同的结果。 用户还可以调整采样迭代步数(inference steps);较高的值需要较长的运行时间,但较小的值可能会导致视觉缺陷。另一个可配置的选项,即无分类指导比例值,允许用户调整提示词的相关性(classifier-free guidance scale value);更具实验性或创造性的用例可以选择较低的值,而旨在获得更具体输出的用例可以使用较高的值。反向提示词(negative prompt)是包含在Stable Diffusion的一些用户界面软件中的一个功能(包括StabilityAI自己的“Dreamstudio”云端软件即服务模式订阅制服务),它允许用户指定模型在图像生成过程中应该避免的提示,适用于由于用户提供的普通提示词,或者由于模型最初的训练,造成图像输出中出现不良的图像特征,例如畸形手脚。与使用强调符(emphasis marker)相比,使用反向提示词在降低生成不良的图像的频率方面具有高度统计显著的效果;强调符是另一种为提示的部分增加权重的方法,被一些Stable Diffusion的开源实现所利用,在关键词中加入括号以增加或减少强调。
参数:
推荐使用QR Toolkit来生成二维码,网站界面如下:
参数介绍:整体的一个构造思想——将二维码和你要绘制的图片融合在一起,使得整体看起来不违和,可以多次尝试。
插件地址:https://github.com/Bing-su/adetailer
安装方式:
步骤:
模型选择:我这里选择国风3,
步数:50
采样器:DPM++ 2M SDE Karras
CFG:7
尺寸:512*512 px
Hire.fix:是否开启高清修复,选择。
Prompts:
masterpiece, top quality, best quality, 1 girl, full body, flowers
Negative Prompts:
(nsfw)), (worst quality, low quality:2) , ng_deepnegative_v1_75t, EasyNegative, badhandv4
Prompts:
(masterpiece, high quality, highres,illustration),blurry background,[(white background:1.2)::5],cowboy shot,
spring (season),(no light:1.1),(temptation:1.2),elegance,
(1loli:1.1),(very long hair:1.1),(blush:0.7),floating hair,ahoge,deep sky,star (sky),
(summer (Floral:1.2) dress:1.1),outline,(see-through:0.85),shining,low twintails,
(polychromatic peony:1.15),Movie poster,(colorful:1.1),ornament,petals,(pantyhose:1.1),
ribbon,
Negative Prompts:
sketch, duplicate, ugly, huge eyes, text, logo, worst face, (bad and mutated hands:1.3), (worst quality:2.0), (low quality:2.0), (blurry:2.0), horror, geometry, bad_prompt, (bad hands), (missing fingers), multiple limbs, bad anatomy, (interlocked fingers:1.2), Ugly Fingers, (extra digit and hands and fingers and legs and arms:1.4), ((2girl)), (deformed fingers:1.2), (long fingers:1.2),(bad-artist-anime), bad-artist, bad hand, extra legs, nipples,nsfw,