详解Keras3.0 KerasCV API: StableDiffusion image-generation model

Stable Diffusion

图像生成模型,可用于根据简短的文本描述(称为“提示”)生成图片

keras_cv.models.StableDiffusion(img_height=512, img_width=512, jit_compile=True)
参数说明 
  • img_height:int,要生成的图像的高度,以像素为单位。请注意,仅支持128的倍数;所提供的值将四舍五入到最接近的有效值。默认值为512。
  • img_width::int,要生成的图像的宽度,以像素为单位。请注意,仅支持128的倍数;所提供的值将四舍五入到最接近的有效值。默认值为512。
  • jitcompile:bool,是否将底层模型编译到XLA。这可能会导致某些系统显著加速。默认为False。
示例
from keras_cv.models import StableDiffusion
from PIL import Image

# 创建一个StableDiffusion模型实例
model = StableDiffusion(img_height=512, img_width=512, jit_compile=True)

# 使用模型将文本转换为图像
img = model.text_to_image(
    prompt="A majestic eagle soaring through the clear blue sky", #提示词
    batch_size=1,  # 同时生成的图像数量
    num_steps=25,  # 迭代次数(控制图像质量)
    seed=123,  # 设置相同的种子值以获得相同的图像
)

# 将生成的图像保存为文件
Image.fromarray(img[0]).save("majestic.png")
print("saved at majestic.png")
结果
A majestic eagle soaring through the clear blue sky

你可能感兴趣的:(stable,diffusion,keras,深度学习)