这应该是本站最好的人工智能资料库
本文由 EasyAI 原创,首发于 CSDN
⌚️ 欢迎点赞 收藏 ⭐留言 如有错误敬请指正!
未来很长,值得我们全力奔赴更美好的生活✋
我能够使用 GoogleColaboratory 以爆炸性的速度实现主题图像生成 AIStableDiffusion。 (我在大约 30 分钟内实现了它) 在这里,我想以爆炸性的速度介绍实现方法等,没有不必要的解释。
一种从文本生成图像的开源 AI。它被称为文本到图像。 2022 年 8 月,英国 Stability AI 在 HuggingFace 上免费发布。
要使用 StableDiffusion,您需要使用 HuggingFace 获取访问令牌。请按照以下步骤获取访问令牌。
请访问此处,检查内容,然后选中复选框以批准。
⚠️您将在访问存储库按钮上方看到一个复选框(此图像未获批准,因为它已获批准)
批准后,从右上角的图标中选择设置。从 Access Tokens 发出 NewToken,复制并粘贴到某处。
从这里开始,我们将使用 Google Colaboratory 实现它。
%cd /content
!pip install diffusers==0.2.4 transformers scipy ftfy
⚠️将之前获得的访问令牌存储在 access_tokens 中。将访问令牌括在双引号 “” 中。
# 导入库
from diffusers import StableDiffusionPipeline
import matplotlib.pyplot as plt
# 设置访问令牌
access_tokens="将之前获得的访问令牌粘贴在这里" # @param {type:"string"}
# 实例化模型
model = StableDiffusionPipeline.from_pretrained("CompVis/stable-diffusion-v1-4", use_auth_token=access_tokens)
model.to("cuda")
输入英文文本。在这里,我称之为“Tokyo Sky Tree by Marc Chagall”。
⚠️这段文字称为咒语。通过输入适当的咒语,您可以生成令人惊叹的图像。在线搜索并尝试不同的东西。
prompt = "Tokyo Sky Tree by Marc Chagall" #@param {type:"string"}
创建图片输出目录,根据文字生成4张图片。图像文件名是指提示。
⚠️ num_inference_steps 将是生成图像所需的步骤数。步数越高,GPU 使用率越高,但图像越详细。如果您使用 ColabPro,请尝试增加该值。默认值为 50。
# 图像输出的目录
!mkdir outputfile
# 图像的文件名
import re
filename = re.sub(r'[\\/:*?"<>|,]+', '', prompt).replace(' ','_')
# 图像的数量
num = 4
for i in range(num):
# 向模型输入提示信息并生成图像。
image = model(prompt,num_inference_steps=100)["sample"][0]
# 保存
outputfile = f'{filename} _{i:02} .png'
image.save(f"outputfile/{outputfile}")
for i in range(num):
outputfile = f'{filename} _{i:02} .png'
plt.imshow(plt.imread(f"outputfile/{outputfile}"))
plt.axis('off')
Tokyo Sky Tree by Marc Chagall(一)
Tokyo Sky Tree by Marc Chagall(二)
Vermeer’s Turtle
Nonsense written by Picasso
其他(一)
我认为您可以使用 GoogleColab 轻松实现它。好吧,我对这个图像生成 AI 感到非常惊讶。未来,艺术的观念可能会彻底改变。请享受StableDiffusion